Training in progress, step 8, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b4a366716e92acd954e30ab9d3d60e7dd40c19db5948b1689ba4d803eb6486e
 size 12609312

 version https://git-lfs.github.com/spec/v1
+oid sha256:591457a7d85945e20c1f6355910df3cd6bbe79e0500209db4be6ed3501be5817
 size 12609312

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fd73b7eaac5174145301610a439b30957974cc586fcfb33b5c62902d9149d44
 size 6614970

 version https://git-lfs.github.com/spec/v1
+oid sha256:c69463b10f69c9e900e42e3a8ef6e28cce2663c7e57c0fc1f56d4c6120b45d84
 size 6614970

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c30b90cacd6043668a9fceb65b4815e3ca7a9635af8292b75bda3517456e3b3
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:9647c1d1489472b2eb35ef1640e8fbfd2b703ac05016081caaa618a2891d4551
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92b4cf85d7ba7a497f88ff799bf4dec5af7dd95be6e00f78bf46ba5deb56bbf8
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a3d18e607a27cfab9cec7cfaa7384cdb877a2330c4bcd4e1efcae25be9908cb
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8067226890756303,
   "eval_steps": 2,
-  "global_step": 6,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -81,6 +81,28 @@
       "eval_samples_per_second": 145.68,
       "eval_steps_per_second": 78.443,
       "step": 6
     }
   ],
   "logging_steps": 1,
@@ -95,12 +117,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 210548557873152.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0756302521008403,
   "eval_steps": 2,
+  "global_step": 8,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 145.68,
       "eval_steps_per_second": 78.443,
       "step": 6
+    },
+    {
+      "epoch": 0.9411764705882353,
+      "grad_norm": 44.79998779296875,
+      "learning_rate": 7e-05,
+      "loss": 10.6719,
+      "step": 7
+    },
+    {
+      "epoch": 1.0756302521008403,
+      "grad_norm": 50.22980880737305,
+      "learning_rate": 8e-05,
+      "loss": 10.1758,
+      "step": 8
+    },
+    {
+      "epoch": 1.0756302521008403,
+      "eval_loss": 0.6066706776618958,
+      "eval_runtime": 0.0922,
+      "eval_samples_per_second": 140.947,
+      "eval_steps_per_second": 75.894,
+      "step": 8
     }
   ],
   "logging_steps": 1,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 280731410497536.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null