Training in progress, step 1500

Browse files

Files changed (7) hide show

model.safetensors +1 -1
run-0/checkpoint-1500/model.safetensors +1 -1
run-0/checkpoint-1500/optimizer.pt +1 -1
run-0/checkpoint-1500/scheduler.pt +1 -1
run-0/checkpoint-1500/trainer_state.json +35 -35
run-0/checkpoint-1500/training_args.bin +1 -1
runs/Aug28_01-37-39_61274092231a/events.out.tfevents.1724809400.61274092231a.346.0 +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:159cc10e43a656e9fb48dd329915584bff3e866e9935e0d23cc3941119248e56
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c477f7a907877bd4f6c28bcf11f979c0482872e341c414cd2ecdfe4a3a59731
 size 268290900

run-0/checkpoint-1500/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6d335d6bf26652e4e9530c02a07335a647ecdc9c69ae094b88a826750d4ee041
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c477f7a907877bd4f6c28bcf11f979c0482872e341c414cd2ecdfe4a3a59731
 size 268290900

run-0/checkpoint-1500/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:50bee8a97c05a2c3df7c107f22d26ca5b034d2a40cba5b1760106e69fdbe4b6e
 size 536643898

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e91cfd6960eae569391d8d796702caa9c32012a7f327762b8d183248cf10077
 size 536643898

run-0/checkpoint-1500/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ad4d7d251acf36e559c362893a1fb310c9f46b20e8a330025a14b6829ce4ab07
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb7b4645e59a5c5cb66f63e8bcb5f006c535fd0ea63db9ae152dd586fd465b28
 size 1064

run-0/checkpoint-1500/trainer_state.json CHANGED Viewed

@@ -10,66 +10,66 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5783870967741935,
-      "eval_loss": 0.19767619669437408,
-      "eval_runtime": 6.8983,
-      "eval_samples_per_second": 449.384,
-      "eval_steps_per_second": 9.423,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
-      "grad_norm": 0.5253991484642029,
-      "learning_rate": 1.550763701707098e-05,
-      "loss": 0.3154,
       "step": 500
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.8151612903225807,
-      "eval_loss": 0.09857291728258133,
-      "eval_runtime": 6.9285,
-      "eval_samples_per_second": 447.424,
-      "eval_steps_per_second": 9.381,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.8722580645161291,
-      "eval_loss": 0.06783536076545715,
-      "eval_runtime": 5.8131,
-      "eval_samples_per_second": 533.278,
-      "eval_steps_per_second": 11.182,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
-      "grad_norm": 0.4484029710292816,
-      "learning_rate": 1.101527403414196e-05,
-      "loss": 0.1139,
       "step": 1000
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.8938709677419355,
-      "eval_loss": 0.05406318977475166,
-      "eval_runtime": 5.9462,
-      "eval_samples_per_second": 521.342,
-      "eval_steps_per_second": 10.931,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
-      "grad_norm": 0.31517869234085083,
-      "learning_rate": 6.522911051212939e-06,
-      "loss": 0.0759,
       "step": 1500
     }
   ],
   "logging_steps": 500,
-  "max_steps": 2226,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 7,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -83,12 +83,12 @@
       "attributes": {}
     }
   },
-  "total_flos": 391368939443328.0,
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.6369202392102897,
-    "num_train_epochs": 7,
-    "temperature": 14
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5922580645161291,
+      "eval_loss": 0.20889601111412048,
+      "eval_runtime": 5.414,
+      "eval_samples_per_second": 572.59,
+      "eval_steps_per_second": 12.006,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
+      "grad_norm": 0.542173445224762,
+      "learning_rate": 1.606918238993711e-05,
+      "loss": 0.3345,
       "step": 500
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.8241935483870968,
+      "eval_loss": 0.10050595551729202,
+      "eval_runtime": 5.7639,
+      "eval_samples_per_second": 537.832,
+      "eval_steps_per_second": 11.277,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.8796774193548387,
+      "eval_loss": 0.06686455011367798,
+      "eval_runtime": 5.5547,
+      "eval_samples_per_second": 558.085,
+      "eval_steps_per_second": 11.702,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
+      "grad_norm": 0.4653903543949127,
+      "learning_rate": 1.2138364779874214e-05,
+      "loss": 0.1167,
       "step": 1000
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.8977419354838709,
+      "eval_loss": 0.0517834909260273,
+      "eval_runtime": 5.5384,
+      "eval_samples_per_second": 559.724,
+      "eval_steps_per_second": 11.736,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
+      "grad_norm": 0.3185347020626068,
+      "learning_rate": 8.207547169811321e-06,
+      "loss": 0.0748,
       "step": 1500
     }
   ],
   "logging_steps": 500,
+  "max_steps": 2544,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 8,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 427404500596416.0,
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.2538508748497722,
+    "num_train_epochs": 8,
+    "temperature": 8
   }
 }

run-0/checkpoint-1500/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd0157c06cf74a0ef8d4bfe1d9f32f70cf2017a9b45a06922514ee718def89a0
 size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:73e9a605faa3902a303e6371d0d6948b2792d2dacb2db5a88d43ea8ab45fc2f6
 size 5176

runs/Aug28_01-37-39_61274092231a/events.out.tfevents.1724809400.61274092231a.346.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a73d06ba0693744765747e187526ad81f0da9830f8c4c2ba780806040997219c
-size 26051

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d0a0f3eff777996b448c97ed48d6c55ed27deed95468535bccb65c3c7f0206d
+size 26585