Training in progress, epoch 3, checkpoint

Browse files

Files changed (4) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +0 -0
last-checkpoint/scheduler.pt +0 -0
last-checkpoint/trainer_state.json +502 -3

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:caa75ba462fc485764d8d1e85a765bd3b713eeb0b6b041e8f5bed4bb5d25ec75
 size 1256

 version https://git-lfs.github.com/spec/v1
+oid sha256:c62c435fa96b78ad6ecac93429cba4d88f3f2af5297b739e4a5280675f4784cf
 size 1256

last-checkpoint/rng_state.pth CHANGED Viewed

Binary files a/last-checkpoint/rng_state.pth and b/last-checkpoint/rng_state.pth differ

last-checkpoint/scheduler.pt CHANGED Viewed

Binary files a/last-checkpoint/scheduler.pt and b/last-checkpoint/scheduler.pt differ

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 2.873922109603882,
   "best_model_checkpoint": "dq158/coqui/checkpoint-40162",
-  "epoch": 2.0,
   "eval_steps": 500,
-  "global_step": 80324,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1005,13 +1005,512 @@
       "eval_steps_per_second": 0.568,
       "eval_translation_length": 4569600,
       "step": 80324
     }
   ],
   "logging_steps": 500,
   "max_steps": 1204860,
   "num_train_epochs": 30,
   "save_steps": 1000,
-  "total_flos": 1.3785697922643395e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 2.873922109603882,
   "best_model_checkpoint": "dq158/coqui/checkpoint-40162",
+  "epoch": 3.0,
   "eval_steps": 500,
+  "global_step": 120486,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.568,
       "eval_translation_length": 4569600,
       "step": 80324
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 7.913219840074152e-05,
+      "loss": 3.0052,
+      "step": 80500
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 7.912135699428588e-05,
+      "loss": 2.9191,
+      "step": 81000
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 7.91104490389186e-05,
+      "loss": 3.0454,
+      "step": 81500
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 7.909947455319513e-05,
+      "loss": 3.0362,
+      "step": 82000
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 7.908843355578402e-05,
+      "loss": 3.016,
+      "step": 82500
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 7.907732606546699e-05,
+      "loss": 3.0735,
+      "step": 83000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 7.906615210113886e-05,
+      "loss": 3.0626,
+      "step": 83500
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 7.905491168180757e-05,
+      "loss": 2.9955,
+      "step": 84000
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 7.904360482659405e-05,
+      "loss": 3.0104,
+      "step": 84500
+    },
+    {
+      "epoch": 2.12,
+      "learning_rate": 7.903223155473227e-05,
+      "loss": 3.0618,
+      "step": 85000
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 7.902079188556919e-05,
+      "loss": 3.0146,
+      "step": 85500
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 7.900928583856469e-05,
+      "loss": 3.0075,
+      "step": 86000
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 7.899771343329159e-05,
+      "loss": 2.9807,
+      "step": 86500
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 7.898607468943558e-05,
+      "loss": 3.0609,
+      "step": 87000
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 7.89743696267952e-05,
+      "loss": 2.9379,
+      "step": 87500
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 7.896259826528179e-05,
+      "loss": 3.0411,
+      "step": 88000
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 7.89507606249195e-05,
+      "loss": 3.0788,
+      "step": 88500
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 7.893885672584521e-05,
+      "loss": 3.115,
+      "step": 89000
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 7.892688658830852e-05,
+      "loss": 3.0927,
+      "step": 89500
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 7.891485023267167e-05,
+      "loss": 2.9474,
+      "step": 90000
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 7.890274767940961e-05,
+      "loss": 3.0862,
+      "step": 90500
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 7.889057894910983e-05,
+      "loss": 3.0357,
+      "step": 91000
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 7.887834406247244e-05,
+      "loss": 3.0165,
+      "step": 91500
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 7.886604304031007e-05,
+      "loss": 3.0627,
+      "step": 92000
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 7.885367590354785e-05,
+      "loss": 3.0763,
+      "step": 92500
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 7.88412426732234e-05,
+      "loss": 3.0735,
+      "step": 93000
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 7.882874337048669e-05,
+      "loss": 2.9523,
+      "step": 93500
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 7.881617801660023e-05,
+      "loss": 2.9885,
+      "step": 94000
+    },
+    {
+      "epoch": 2.35,
+      "learning_rate": 7.880354663293875e-05,
+      "loss": 2.9825,
+      "step": 94500
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 7.879084924098938e-05,
+      "loss": 2.9537,
+      "step": 95000
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 7.877808586235151e-05,
+      "loss": 3.0941,
+      "step": 95500
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 7.876525651873679e-05,
+      "loss": 3.0817,
+      "step": 96000
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 7.875236123196905e-05,
+      "loss": 3.0927,
+      "step": 96500
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 7.873940002398435e-05,
+      "loss": 2.9777,
+      "step": 97000
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 7.872637291683084e-05,
+      "loss": 3.0594,
+      "step": 97500
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 7.871327993266882e-05,
+      "loss": 3.0813,
+      "step": 98000
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 7.870012109377058e-05,
+      "loss": 3.0248,
+      "step": 98500
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 7.868689642252051e-05,
+      "loss": 2.9885,
+      "step": 99000
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 7.867360594141493e-05,
+      "loss": 3.037,
+      "step": 99500
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 7.866024967306214e-05,
+      "loss": 3.1189,
+      "step": 100000
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 7.864682764018236e-05,
+      "loss": 2.9825,
+      "step": 100500
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 7.863333986560763e-05,
+      "loss": 3.0277,
+      "step": 101000
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 7.861978637228187e-05,
+      "loss": 3.1551,
+      "step": 101500
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 7.860616718326079e-05,
+      "loss": 3.0137,
+      "step": 102000
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 7.859248232171184e-05,
+      "loss": 3.0373,
+      "step": 102500
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 7.857873181091416e-05,
+      "loss": 3.0931,
+      "step": 103000
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 7.856491567425863e-05,
+      "loss": 3.0635,
+      "step": 103500
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 7.85510339352477e-05,
+      "loss": 3.0677,
+      "step": 104000
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 7.853708661749548e-05,
+      "loss": 3.0483,
+      "step": 104500
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 7.852307374472755e-05,
+      "loss": 2.9974,
+      "step": 105000
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 7.850899534078111e-05,
+      "loss": 3.0567,
+      "step": 105500
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 7.849485142960473e-05,
+      "loss": 3.0159,
+      "step": 106000
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 7.848064203525849e-05,
+      "loss": 3.0221,
+      "step": 106500
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 7.846636718191382e-05,
+      "loss": 2.9791,
+      "step": 107000
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 7.845202689385353e-05,
+      "loss": 2.9952,
+      "step": 107500
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 7.843762119547172e-05,
+      "loss": 2.997,
+      "step": 108000
+    },
+    {
+      "epoch": 2.7,
+      "learning_rate": 7.842315011127377e-05,
+      "loss": 2.9545,
+      "step": 108500
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 7.840861366587628e-05,
+      "loss": 3.0655,
+      "step": 109000
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 7.839401188400704e-05,
+      "loss": 3.0671,
+      "step": 109500
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 7.837934479050496e-05,
+      "loss": 3.0327,
+      "step": 110000
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 7.836461241032011e-05,
+      "loss": 3.0038,
+      "step": 110500
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 7.834981476851354e-05,
+      "loss": 3.0443,
+      "step": 111000
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 7.83349518902574e-05,
+      "loss": 2.9654,
+      "step": 111500
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 7.832002380083474e-05,
+      "loss": 3.0335,
+      "step": 112000
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 7.830503052563956e-05,
+      "loss": 3.0491,
+      "step": 112500
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 7.828997209017678e-05,
+      "loss": 3.0643,
+      "step": 113000
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 7.827484852006215e-05,
+      "loss": 3.1021,
+      "step": 113500
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 7.825965984102216e-05,
+      "loss": 3.0631,
+      "step": 114000
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 7.824440607889415e-05,
+      "loss": 2.9952,
+      "step": 114500
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 7.822908725962612e-05,
+      "loss": 3.0093,
+      "step": 115000
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 7.821370340927674e-05,
+      "loss": 2.9657,
+      "step": 115500
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 7.819825455401529e-05,
+      "loss": 3.0453,
+      "step": 116000
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 7.818274072012168e-05,
+      "loss": 3.0879,
+      "step": 116500
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 7.81671619339863e-05,
+      "loss": 2.9641,
+      "step": 117000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 7.815151822211007e-05,
+      "loss": 3.0363,
+      "step": 117500
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 7.813580961110435e-05,
+      "loss": 3.051,
+      "step": 118000
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 7.812003612769084e-05,
+      "loss": 3.0135,
+      "step": 118500
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 7.810419779870166e-05,
+      "loss": 2.9968,
+      "step": 119000
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 7.808829465107923e-05,
+      "loss": 3.0569,
+      "step": 119500
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 7.80723267118762e-05,
+      "loss": 3.0546,
+      "step": 120000
+    },
+    {
+      "epoch": 3.0,
+      "eval_bleu": 1.0,
+      "eval_brevity_penalty": 1.0,
+      "eval_length_ratio": 1.0,
+      "eval_loss": 2.873922109603882,
+      "eval_precisions": [
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_reference_length": 4569600,
+      "eval_runtime": 7544.7431,
+      "eval_samples_per_second": 1.183,
+      "eval_steps_per_second": 0.592,
+      "eval_translation_length": 4569600,
+      "step": 120486
     }
   ],
   "logging_steps": 500,
   "max_steps": 1204860,
   "num_train_epochs": 30,
   "save_steps": 1000,
+  "total_flos": 2.0678546883965092e+18,
   "trial_name": null,
   "trial_params": null
 }