fay-ong
/

llama-3-8b-finetuned

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

fay-ong commited on Jun 2

Commit

a8a09fb

•

1 Parent(s): 75b8453

End of training

Files changed (4) hide show

README.md +3 -2
all_results.json +3 -3
train_results.json +3 -3
trainer_state.json +3 -3

README.md CHANGED Viewed

@@ -2,8 +2,9 @@
 license: apache-2.0
 library_name: peft
 tags:
-- unsloth
 - llama-factory
 - generated_from_trainer
 base_model: unsloth/llama-3-8b-Instruct-bnb-4bit
 model-index:
@@ -16,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 # llama-3-8b-finetuned
-This model is a fine-tuned version of [unsloth/llama-3-8b-Instruct-bnb-4bit](https://huggingface.co/unsloth/llama-3-8b-Instruct-bnb-4bit) on an unknown dataset.
 ## Model description

 license: apache-2.0
 library_name: peft
 tags:
 - llama-factory
+- lora
+- unsloth
 - generated_from_trainer
 base_model: unsloth/llama-3-8b-Instruct-bnb-4bit
 model-index:
 # llama-3-8b-finetuned
+This model is a fine-tuned version of [unsloth/llama-3-8b-Instruct-bnb-4bit](https://huggingface.co/unsloth/llama-3-8b-Instruct-bnb-4bit) on the formatted_data dataset.
 ## Model description

all_results.json CHANGED Viewed

@@ -2,7 +2,7 @@
     "epoch": 2.0,
     "total_flos": 1.5362943036162048e+16,
     "train_loss": 0.16884834933280946,
-    "train_runtime": 1433.2088,
-    "train_samples_per_second": 0.698,
-    "train_steps_per_second": 0.174
 }

     "epoch": 2.0,
     "total_flos": 1.5362943036162048e+16,
     "train_loss": 0.16884834933280946,
+    "train_runtime": 1424.4252,
+    "train_samples_per_second": 0.702,
+    "train_steps_per_second": 0.176
 }

train_results.json CHANGED Viewed

@@ -2,7 +2,7 @@
     "epoch": 2.0,
     "total_flos": 1.5362943036162048e+16,
     "train_loss": 0.16884834933280946,
-    "train_runtime": 1433.2088,
-    "train_samples_per_second": 0.698,
-    "train_steps_per_second": 0.174
 }

     "epoch": 2.0,
     "total_flos": 1.5362943036162048e+16,
     "train_loss": 0.16884834933280946,
+    "train_runtime": 1424.4252,
+    "train_samples_per_second": 0.702,
+    "train_steps_per_second": 0.176
 }

trainer_state.json CHANGED Viewed

@@ -188,9 +188,9 @@
       "step": 250,
       "total_flos": 1.5362943036162048e+16,
       "train_loss": 0.16884834933280946,
-      "train_runtime": 1433.2088,
-      "train_samples_per_second": 0.698,
-      "train_steps_per_second": 0.174
     }
   ],
   "logging_steps": 10,

       "step": 250,
       "total_flos": 1.5362943036162048e+16,
       "train_loss": 0.16884834933280946,
+      "train_runtime": 1424.4252,
+      "train_samples_per_second": 0.702,
+      "train_steps_per_second": 0.176
     }
   ],
   "logging_steps": 10,