Training in progress, step 1000, checkpoint

Files changed (6) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0eb0dab17a42c3a294e014713e68fdda48d2d44739ea13671697f2a301d2d4a2
 size 5125261

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9689b9f0527ef69eaf40c04582a46896dec254a13f9e6543c57ecbe26f9784c
 size 5125261

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8bd222a910deb203707980d7bf8849ee8622740e831fb4a29e978fe834b784f1
 size 2460465086

 version https://git-lfs.github.com/spec/v1
+oid sha256:24ebb60a3a9c5fe279068d726787f339228db50963f678eaced9e177c149c9fb
 size 2460465086

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:281dcb6188ca929add3bbd3d8482d5d613fad78db0459294a06701b5f772e994
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:4558773c2541a5a022e4ec2e47d3339b64f91f90908327276dc2eb4fefc1ab74
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5bf7a6e26d7d48d4b983689c6ff083f88c2481c6d90f1895404707067b467449
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5bbff6876531d3e6111ff71974a9625b415ff732fa62571778e1d69f33c1ffc
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 3.7452237606048584,
-  "best_model_checkpoint": "smilemikan/nllb-finetuned-jpn-to-ain-2/checkpoint-500",
-  "epoch": 0.11015642211940956,
   "eval_steps": 500,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -21,13 +21,27 @@
       "eval_samples_per_second": 208.278,
       "eval_steps_per_second": 13.032,
       "step": 500
     }
   ],
   "logging_steps": 500,
   "max_steps": 60000,
   "num_train_epochs": 14,
   "save_steps": 500,
-  "total_flos": 520613019648000.0,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 3.2064383029937744,
+  "best_model_checkpoint": "smilemikan/nllb-finetuned-jpn-to-ain-2/checkpoint-1000",
+  "epoch": 0.2203128442388191,
   "eval_steps": 500,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 208.278,
       "eval_steps_per_second": 13.032,
       "step": 500
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 1.9666666666666666e-05,
+      "loss": 3.5915,
+      "step": 1000
+    },
+    {
+      "epoch": 0.22,
+      "eval_loss": 3.2064383029937744,
+      "eval_runtime": 43.0726,
+      "eval_samples_per_second": 210.76,
+      "eval_steps_per_second": 13.187,
+      "step": 1000
     }
   ],
   "logging_steps": 500,
   "max_steps": 60000,
   "num_train_epochs": 14,
   "save_steps": 500,
+  "total_flos": 1033641173188608.0,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3efe3f2e5d4244ec2d74514b0c0691e235fa08869ff5eeaaf90e9a0c5522da59
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:a163d9deb4d5122dff8a686e76f2f67862f17e93c9467c87d4eaf4d9981a61bf
 size 4664