End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +6 -6
runs/Jul28_14-07-40_8444a3ebd71c/events.out.tfevents.1690554363.8444a3ebd71c.1196.1 +3 -0
train_results.json +6 -6
trainer_state.json +126 -450

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 50.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.020261267200112343,
-    "eval_runtime": 1.8244,
-    "eval_samples_per_second": 19.733,
-    "eval_steps_per_second": 0.548,
-    "total_flos": 3.989386232229888e+17,
-    "train_loss": 0.12627770403089622,
-    "train_runtime": 1656.8438,
-    "train_samples_per_second": 9.687,
-    "train_steps_per_second": 0.091
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.4,
+    "eval_loss": 0.7953054904937744,
+    "eval_runtime": 2.2455,
+    "eval_samples_per_second": 20.04,
+    "eval_steps_per_second": 0.445,
+    "total_flos": 1.7747176135901184e+17,
+    "train_loss": 0.1779410476485888,
+    "train_runtime": 979.9272,
+    "train_samples_per_second": 7.286,
+    "train_steps_per_second": 0.061
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 50.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.020261267200112343,
-    "eval_runtime": 1.8244,
-    "eval_samples_per_second": 19.733,
-    "eval_steps_per_second": 0.548
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.4,
+    "eval_loss": 0.7953054904937744,
+    "eval_runtime": 2.2455,
+    "eval_samples_per_second": 20.04,
+    "eval_steps_per_second": 0.445
 }

runs/Jul28_14-07-40_8444a3ebd71c/events.out.tfevents.1690554363.8444a3ebd71c.1196.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:570d924efa2792091a5cc016a749af6141a0489eab1795854922becc34ad8dd5
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 50.0,
-    "total_flos": 3.989386232229888e+17,
-    "train_loss": 0.12627770403089622,
-    "train_runtime": 1656.8438,
-    "train_samples_per_second": 9.687,
-    "train_steps_per_second": 0.091
 }

 {
+    "epoch": 20.0,
+    "total_flos": 1.7747176135901184e+17,
+    "train_loss": 0.1779410476485888,
+    "train_runtime": 979.9272,
+    "train_samples_per_second": 7.286,
+    "train_steps_per_second": 0.061
 }

trainer_state.json CHANGED Viewed

@@ -1,565 +1,241 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-wuhan/checkpoint-51",
-  "epoch": 50.0,
-  "global_step": 150,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_loss": 0.6245499849319458,
-      "eval_runtime": 24.4847,
-      "eval_samples_per_second": 1.47,
-      "eval_steps_per_second": 0.041,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_loss": 0.5320722460746765,
-      "eval_runtime": 1.652,
-      "eval_samples_per_second": 21.791,
-      "eval_steps_per_second": 0.605,
       "step": 6
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_loss": 0.5123355388641357,
-      "eval_runtime": 1.6429,
-      "eval_samples_per_second": 21.912,
-      "eval_steps_per_second": 0.609,
       "step": 9
     },
     {
       "epoch": 3.33,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.6482,
       "step": 10
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_loss": 0.4955737888813019,
-      "eval_runtime": 1.6364,
-      "eval_samples_per_second": 22.0,
-      "eval_steps_per_second": 0.611,
       "step": 12
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.7777777777777778,
-      "eval_loss": 0.4585157632827759,
-      "eval_runtime": 1.6942,
-      "eval_samples_per_second": 21.249,
-      "eval_steps_per_second": 0.59,
       "step": 15
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.8611111111111112,
-      "eval_loss": 0.374308705329895,
-      "eval_runtime": 1.632,
-      "eval_samples_per_second": 22.058,
-      "eval_steps_per_second": 0.613,
       "step": 18
     },
     {
       "epoch": 6.67,
-      "learning_rate": 4.814814814814815e-05,
-      "loss": 0.5574,
       "step": 20
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.9166666666666666,
-      "eval_loss": 0.28418225049972534,
-      "eval_runtime": 1.6051,
-      "eval_samples_per_second": 22.429,
-      "eval_steps_per_second": 0.623,
       "step": 21
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.9166666666666666,
-      "eval_loss": 0.21250946819782257,
-      "eval_runtime": 1.6507,
-      "eval_samples_per_second": 21.809,
-      "eval_steps_per_second": 0.606,
       "step": 24
     },
     {
       "epoch": 9.0,
-      "eval_accuracy": 0.9166666666666666,
-      "eval_loss": 0.268328458070755,
-      "eval_runtime": 1.6501,
-      "eval_samples_per_second": 21.816,
-      "eval_steps_per_second": 0.606,
       "step": 27
     },
     {
       "epoch": 10.0,
-      "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.4882,
       "step": 30
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.9444444444444444,
-      "eval_loss": 0.13163453340530396,
-      "eval_runtime": 1.6879,
-      "eval_samples_per_second": 21.329,
-      "eval_steps_per_second": 0.592,
       "step": 30
     },
     {
       "epoch": 11.0,
-      "eval_accuracy": 0.9444444444444444,
-      "eval_loss": 0.13660234212875366,
-      "eval_runtime": 1.7137,
-      "eval_samples_per_second": 21.007,
-      "eval_steps_per_second": 0.584,
       "step": 33
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.9722222222222222,
-      "eval_loss": 0.07448268681764603,
-      "eval_runtime": 1.7626,
-      "eval_samples_per_second": 20.424,
-      "eval_steps_per_second": 0.567,
       "step": 36
     },
     {
       "epoch": 13.0,
-      "eval_accuracy": 0.9444444444444444,
-      "eval_loss": 0.10653182864189148,
-      "eval_runtime": 1.7029,
-      "eval_samples_per_second": 21.14,
-      "eval_steps_per_second": 0.587,
       "step": 39
     },
     {
       "epoch": 13.33,
-      "learning_rate": 4.074074074074074e-05,
-      "loss": 0.0907,
       "step": 40
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.9722222222222222,
-      "eval_loss": 0.04769667983055115,
-      "eval_runtime": 1.7434,
-      "eval_samples_per_second": 20.65,
-      "eval_steps_per_second": 0.574,
       "step": 42
     },
     {
       "epoch": 15.0,
-      "eval_accuracy": 0.9444444444444444,
-      "eval_loss": 0.045971717685461044,
-      "eval_runtime": 1.6711,
-      "eval_samples_per_second": 21.543,
-      "eval_steps_per_second": 0.598,
       "step": 45
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.9722222222222222,
-      "eval_loss": 0.04381129518151283,
-      "eval_runtime": 1.6352,
-      "eval_samples_per_second": 22.016,
-      "eval_steps_per_second": 0.612,
       "step": 48
     },
     {
       "epoch": 16.67,
-      "learning_rate": 3.7037037037037037e-05,
-      "loss": 0.0481,
       "step": 50
     },
     {
       "epoch": 17.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.020261267200112343,
-      "eval_runtime": 1.6614,
-      "eval_samples_per_second": 21.668,
-      "eval_steps_per_second": 0.602,
       "step": 51
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.009294789284467697,
-      "eval_runtime": 1.6224,
-      "eval_samples_per_second": 22.19,
-      "eval_steps_per_second": 0.616,
       "step": 54
     },
     {
       "epoch": 19.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.008234969340264797,
-      "eval_runtime": 1.6449,
-      "eval_samples_per_second": 21.885,
-      "eval_steps_per_second": 0.608,
       "step": 57
     },
     {
       "epoch": 20.0,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.013,
       "step": 60
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0017433015163987875,
-      "eval_runtime": 1.6486,
-      "eval_samples_per_second": 21.837,
-      "eval_steps_per_second": 0.607,
       "step": 60
     },
     {
-      "epoch": 21.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0007768174400553107,
-      "eval_runtime": 1.7052,
-      "eval_samples_per_second": 21.112,
-      "eval_steps_per_second": 0.586,
-      "step": 63
-    },
-    {
-      "epoch": 22.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.00018507178174331784,
-      "eval_runtime": 1.7002,
-      "eval_samples_per_second": 21.174,
-      "eval_steps_per_second": 0.588,
-      "step": 66
-    },
-    {
-      "epoch": 23.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.00012737045472022146,
-      "eval_runtime": 1.6699,
-      "eval_samples_per_second": 21.558,
-      "eval_steps_per_second": 0.599,
-      "step": 69
-    },
-    {
-      "epoch": 23.33,
-      "learning_rate": 2.962962962962963e-05,
-      "loss": 0.0101,
-      "step": 70
-    },
-    {
-      "epoch": 24.0,
-      "eval_accuracy": 0.9722222222222222,
-      "eval_loss": 0.09382671862840652,
-      "eval_runtime": 1.6527,
-      "eval_samples_per_second": 21.783,
-      "eval_steps_per_second": 0.605,
-      "step": 72
-    },
-    {
-      "epoch": 25.0,
-      "eval_accuracy": 0.9722222222222222,
-      "eval_loss": 0.10189218819141388,
-      "eval_runtime": 1.6545,
-      "eval_samples_per_second": 21.758,
-      "eval_steps_per_second": 0.604,
-      "step": 75
-    },
-    {
-      "epoch": 26.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0005055955843999982,
-      "eval_runtime": 1.7212,
-      "eval_samples_per_second": 20.916,
-      "eval_steps_per_second": 0.581,
-      "step": 78
-    },
-    {
-      "epoch": 26.67,
-      "learning_rate": 2.5925925925925925e-05,
-      "loss": 0.0085,
-      "step": 80
-    },
-    {
-      "epoch": 27.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.9300923668197356e-05,
-      "eval_runtime": 1.7849,
-      "eval_samples_per_second": 20.17,
-      "eval_steps_per_second": 0.56,
-      "step": 81
-    },
-    {
-      "epoch": 28.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.1416644156270195e-05,
-      "eval_runtime": 1.7789,
-      "eval_samples_per_second": 20.237,
-      "eval_steps_per_second": 0.562,
-      "step": 84
-    },
-    {
-      "epoch": 29.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 5.5924607295310125e-05,
-      "eval_runtime": 1.6926,
-      "eval_samples_per_second": 21.269,
-      "eval_steps_per_second": 0.591,
-      "step": 87
-    },
-    {
-      "epoch": 30.0,
-      "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.0196,
-      "step": 90
-    },
-    {
-      "epoch": 30.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.00011896187061211094,
-      "eval_runtime": 1.6527,
-      "eval_samples_per_second": 21.782,
-      "eval_steps_per_second": 0.605,
-      "step": 90
-    },
-    {
-      "epoch": 31.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.00012139210593886673,
-      "eval_runtime": 1.6483,
-      "eval_samples_per_second": 21.841,
-      "eval_steps_per_second": 0.607,
-      "step": 93
-    },
-    {
-      "epoch": 32.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 4.184916542726569e-05,
-      "eval_runtime": 1.6727,
-      "eval_samples_per_second": 21.523,
-      "eval_steps_per_second": 0.598,
-      "step": 96
-    },
-    {
-      "epoch": 33.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.933595194714144e-05,
-      "eval_runtime": 1.6406,
-      "eval_samples_per_second": 21.943,
-      "eval_steps_per_second": 0.61,
-      "step": 99
-    },
-    {
-      "epoch": 33.33,
-      "learning_rate": 1.8518518518518518e-05,
-      "loss": 0.0027,
-      "step": 100
-    },
-    {
-      "epoch": 34.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.333714862994384e-05,
-      "eval_runtime": 1.6592,
-      "eval_samples_per_second": 21.697,
-      "eval_steps_per_second": 0.603,
-      "step": 102
-    },
-    {
-      "epoch": 35.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 8.897241968952585e-06,
-      "eval_runtime": 1.6396,
-      "eval_samples_per_second": 21.957,
-      "eval_steps_per_second": 0.61,
-      "step": 105
-    },
-    {
-      "epoch": 36.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 7.099337835825281e-06,
-      "eval_runtime": 1.6407,
-      "eval_samples_per_second": 21.942,
-      "eval_steps_per_second": 0.61,
-      "step": 108
-    },
-    {
-      "epoch": 36.67,
-      "learning_rate": 1.4814814814814815e-05,
-      "loss": 0.0016,
-      "step": 110
-    },
-    {
-      "epoch": 37.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 5.609323125099763e-06,
-      "eval_runtime": 1.6715,
-      "eval_samples_per_second": 21.538,
-      "eval_steps_per_second": 0.598,
-      "step": 111
-    },
-    {
-      "epoch": 38.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 4.562983122013975e-06,
-      "eval_runtime": 1.9201,
-      "eval_samples_per_second": 18.749,
-      "eval_steps_per_second": 0.521,
-      "step": 114
-    },
-    {
-      "epoch": 39.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 3.596098849811824e-06,
-      "eval_runtime": 2.0826,
-      "eval_samples_per_second": 17.286,
-      "eval_steps_per_second": 0.48,
-      "step": 117
-    },
-    {
-      "epoch": 40.0,
-      "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.0021,
-      "step": 120
-    },
-    {
-      "epoch": 40.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 3.2384773476223927e-06,
-      "eval_runtime": 1.6679,
-      "eval_samples_per_second": 21.585,
-      "eval_steps_per_second": 0.6,
-      "step": 120
-    },
-    {
-      "epoch": 41.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 3.013309651578311e-06,
-      "eval_runtime": 1.6498,
-      "eval_samples_per_second": 21.82,
-      "eval_steps_per_second": 0.606,
-      "step": 123
-    },
-    {
-      "epoch": 42.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 2.781519697236945e-06,
-      "eval_runtime": 1.6569,
-      "eval_samples_per_second": 21.728,
-      "eval_steps_per_second": 0.604,
-      "step": 126
-    },
-    {
-      "epoch": 43.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 2.4669488993822597e-06,
-      "eval_runtime": 1.6535,
-      "eval_samples_per_second": 21.772,
-      "eval_steps_per_second": 0.605,
-      "step": 129
-    },
-    {
-      "epoch": 43.33,
-      "learning_rate": 7.4074074074074075e-06,
-      "loss": 0.0024,
-      "step": 130
-    },
-    {
-      "epoch": 44.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 2.09608538170869e-06,
-      "eval_runtime": 1.6274,
-      "eval_samples_per_second": 22.121,
-      "eval_steps_per_second": 0.614,
-      "step": 132
-    },
-    {
-      "epoch": 45.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.89409422546305e-06,
-      "eval_runtime": 1.6472,
-      "eval_samples_per_second": 21.856,
-      "eval_steps_per_second": 0.607,
-      "step": 135
-    },
-    {
-      "epoch": 46.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.821245518840442e-06,
-      "eval_runtime": 1.646,
-      "eval_samples_per_second": 21.872,
-      "eval_steps_per_second": 0.608,
-      "step": 138
-    },
-    {
-      "epoch": 46.67,
-      "learning_rate": 3.7037037037037037e-06,
-      "loss": 0.0009,
-      "step": 140
-    },
-    {
-      "epoch": 47.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.8709155256146914e-06,
-      "eval_runtime": 1.6474,
-      "eval_samples_per_second": 21.852,
-      "eval_steps_per_second": 0.607,
-      "step": 141
-    },
-    {
-      "epoch": 48.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 1.9536980744305765e-06,
-      "eval_runtime": 1.6639,
-      "eval_samples_per_second": 21.636,
-      "eval_steps_per_second": 0.601,
-      "step": 144
-    },
-    {
-      "epoch": 49.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 2.006679324040306e-06,
-      "eval_runtime": 1.6581,
-      "eval_samples_per_second": 21.712,
-      "eval_steps_per_second": 0.603,
-      "step": 147
-    },
-    {
-      "epoch": 50.0,
-      "learning_rate": 0.0,
-      "loss": 0.0006,
-      "step": 150
-    },
-    {
-      "epoch": 50.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 2.0265476905478863e-06,
-      "eval_runtime": 1.7006,
-      "eval_samples_per_second": 21.169,
-      "eval_steps_per_second": 0.588,
-      "step": 150
-    },
-    {
-      "epoch": 50.0,
-      "step": 150,
-      "total_flos": 3.989386232229888e+17,
-      "train_loss": 0.12627770403089622,
-      "train_runtime": 1656.8438,
-      "train_samples_per_second": 9.687,
-      "train_steps_per_second": 0.091
     }
   ],
-  "max_steps": 150,
-  "num_train_epochs": 50,
-  "total_flos": 3.989386232229888e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.7953054904937744,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-wuhan/checkpoint-3",
+  "epoch": 20.0,
+  "global_step": 60,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 0.7953054904937744,
+      "eval_runtime": 38.7172,
+      "eval_samples_per_second": 1.162,
+      "eval_steps_per_second": 0.026,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 0.9477012753486633,
+      "eval_runtime": 2.1877,
+      "eval_samples_per_second": 20.569,
+      "eval_steps_per_second": 0.457,
       "step": 6
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 1.010606050491333,
+      "eval_runtime": 2.1562,
+      "eval_samples_per_second": 20.87,
+      "eval_steps_per_second": 0.464,
       "step": 9
     },
     {
       "epoch": 3.33,
+      "learning_rate": 4.62962962962963e-05,
+      "loss": 0.5883,
       "step": 10
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 1.417040228843689,
+      "eval_runtime": 2.225,
+      "eval_samples_per_second": 20.225,
+      "eval_steps_per_second": 0.449,
       "step": 12
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 1.7435767650604248,
+      "eval_runtime": 2.2394,
+      "eval_samples_per_second": 20.095,
+      "eval_steps_per_second": 0.447,
       "step": 15
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 2.5379722118377686,
+      "eval_runtime": 2.1794,
+      "eval_samples_per_second": 20.648,
+      "eval_steps_per_second": 0.459,
       "step": 18
     },
     {
       "epoch": 6.67,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.241,
       "step": 20
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 3.8802621364593506,
+      "eval_runtime": 2.1868,
+      "eval_samples_per_second": 20.578,
+      "eval_steps_per_second": 0.457,
       "step": 21
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 2.4039711952209473,
+      "eval_runtime": 2.2635,
+      "eval_samples_per_second": 19.881,
+      "eval_steps_per_second": 0.442,
       "step": 24
     },
     {
       "epoch": 9.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 3.9967715740203857,
+      "eval_runtime": 2.2078,
+      "eval_samples_per_second": 20.382,
+      "eval_steps_per_second": 0.453,
       "step": 27
     },
     {
       "epoch": 10.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.125,
       "step": 30
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 3.27313494682312,
+      "eval_runtime": 2.2426,
+      "eval_samples_per_second": 20.066,
+      "eval_steps_per_second": 0.446,
       "step": 30
     },
     {
       "epoch": 11.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 3.2202415466308594,
+      "eval_runtime": 2.281,
+      "eval_samples_per_second": 19.728,
+      "eval_steps_per_second": 0.438,
       "step": 33
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.4,
+      "eval_loss": 4.70084285736084,
+      "eval_runtime": 2.2753,
+      "eval_samples_per_second": 19.777,
+      "eval_steps_per_second": 0.439,
       "step": 36
     },
     {
       "epoch": 13.0,
+      "eval_accuracy": 0.35555555555555557,
+      "eval_loss": 4.558761119842529,
+      "eval_runtime": 2.2218,
+      "eval_samples_per_second": 20.254,
+      "eval_steps_per_second": 0.45,
       "step": 39
     },
     {
       "epoch": 13.33,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.0766,
       "step": 40
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.24444444444444444,
+      "eval_loss": 4.54338264465332,
+      "eval_runtime": 2.2251,
+      "eval_samples_per_second": 20.223,
+      "eval_steps_per_second": 0.449,
       "step": 42
     },
     {
       "epoch": 15.0,
+      "eval_accuracy": 0.26666666666666666,
+      "eval_loss": 4.979237079620361,
+      "eval_runtime": 2.4295,
+      "eval_samples_per_second": 18.522,
+      "eval_steps_per_second": 0.412,
       "step": 45
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.26666666666666666,
+      "eval_loss": 5.409503936767578,
+      "eval_runtime": 2.1939,
+      "eval_samples_per_second": 20.512,
+      "eval_steps_per_second": 0.456,
       "step": 48
     },
     {
       "epoch": 16.67,
+      "learning_rate": 9.259259259259259e-06,
+      "loss": 0.0239,
       "step": 50
     },
     {
       "epoch": 17.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 5.850742816925049,
+      "eval_runtime": 2.2566,
+      "eval_samples_per_second": 19.942,
+      "eval_steps_per_second": 0.443,
       "step": 51
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 6.102282524108887,
+      "eval_runtime": 2.2779,
+      "eval_samples_per_second": 19.755,
+      "eval_steps_per_second": 0.439,
       "step": 54
     },
     {
       "epoch": 19.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 6.166590213775635,
+      "eval_runtime": 2.257,
+      "eval_samples_per_second": 19.938,
+      "eval_steps_per_second": 0.443,
       "step": 57
     },
     {
       "epoch": 20.0,
+      "learning_rate": 0.0,
+      "loss": 0.0129,
       "step": 60
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.2222222222222222,
+      "eval_loss": 6.194781303405762,
+      "eval_runtime": 2.3123,
+      "eval_samples_per_second": 19.461,
+      "eval_steps_per_second": 0.432,
       "step": 60
     },
     {
+      "epoch": 20.0,
+      "step": 60,
+      "total_flos": 1.7747176135901184e+17,
+      "train_loss": 0.1779410476485888,
+      "train_runtime": 979.9272,
+      "train_samples_per_second": 7.286,
+      "train_steps_per_second": 0.061
     }
   ],
+  "max_steps": 60,
+  "num_train_epochs": 20,
+  "total_flos": 1.7747176135901184e+17,
   "trial_name": null,
   "trial_params": null
 }