Training in progress, epoch 2, checkpoint

Browse files

Files changed (5) hide show

checkpoint-162/model.safetensors +1 -1
checkpoint-162/optimizer.pt +1 -1
checkpoint-162/rng_state.pth +1 -1
checkpoint-162/trainer_state.json +85 -85
checkpoint-162/training_args.bin +1 -1

checkpoint-162/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a11f15760b563aa1d3a7b3d90cd4a163933ed6cfef5a36abd0cf3e23f25109ec
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:a4b58243a1c6c70c34fdfa99974168647d6cfa2254a0a7b10f1c6d88e82b1c86
 size 592330980

checkpoint-162/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1300dab147626c676f3d1f88ae733997ed664f7f1dfd386d53f5322f16d84ebe
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:1cfe954178075e881c251e724c6a218f6ad48ddd078f08995a231b6bfd68ecf4
 size 1014670074

checkpoint-162/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88e210ec99a19f026e2def82a9c5587c47c7771d7dd08d2e2ba3261c169c79d9
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:6613e657dfa5c91f076329239ba74e9bccea696a05690b1f35a5faffc85df4aa
 size 14244

checkpoint-162/trainer_state.json CHANGED Viewed

@@ -11,126 +11,126 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.18764302059496568,
-        "precision": 0.3416666666666667,
-        "recall": 0.12933753943217666,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.19540229885057472,
-        "precision": 0.8947368421052632,
-        "recall": 0.10967741935483871,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8476339053562143,
-        "precision": 0.740909090909091,
-        "recall": 0.9902794653705954,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.4315998169894769,
-        "precision": 0.6394035246272028,
-        "recall": 0.3257366482504604,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.7779799818016379,
-        "precision": 0.7493426818580193,
-        "recall": 0.8088930936613056,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8948683715038855,
-        "precision": 0.8376057421174058,
-        "recall": 0.9605350187403542,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9980147987727848,
-        "precision": 0.9970251509961237,
-        "recall": 0.9990064131514769,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8673183065585397,
-      "eval_loss": 0.3193369209766388,
       "eval_macro avg": {
-        "f1-score": 0.6190203134099342,
-        "precision": 0.7429556713256817,
-        "recall": 0.6176379425658869,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9083,
-      "eval_samples_per_second": 16.299,
-      "eval_steps_per_second": 2.037,
       "eval_weighted avg": {
-        "f1-score": 0.8489527906249091,
-        "precision": 0.8526967051825685,
-        "recall": 0.8673183065585397,
-        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.583941605839416,
-        "precision": 0.6926406926406926,
-        "recall": 0.5047318611987381,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8117647058823529,
-        "precision": 0.745945945945946,
-        "recall": 0.8903225806451613,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8943661971830986,
-        "precision": 0.8649262202043133,
-        "recall": 0.9258809234507898,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6197740770932805,
-        "precision": 0.6271506009898656,
-        "recall": 0.6125690607734806,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8298737427776589,
-        "precision": 0.7577178585384916,
-        "recall": 0.9172185430463576,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9013697613125952,
-        "precision": 0.9106660666066607,
-        "recall": 0.8922613360770192,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9961487925331883,
-        "precision": 0.9993636363636363,
-        "recall": 0.9929545659831993,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.887854213561099,
-      "eval_loss": 0.26407390832901,
       "eval_macro avg": {
-        "f1-score": 0.8053198403745129,
-        "precision": 0.7997730030413723,
-        "recall": 0.8194198387392494,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9329,
-      "eval_samples_per_second": 16.218,
-      "eval_steps_per_second": 2.027,
       "eval_weighted avg": {
-        "f1-score": 0.8876368199002541,
-        "precision": 0.8889201304482091,
-        "recall": 0.887854213561099,
-        "support": 32431.0
       },
       "step": 162
     }
@@ -140,7 +140,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 287581625436000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.17153996101364524,
+        "precision": 0.25287356321839083,
+        "recall": 0.12979351032448377,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.08383233532934131,
+        "precision": 1.0,
+        "recall": 0.04375,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8469620831429876,
+        "precision": 0.7427884615384616,
+        "recall": 0.9851222104144527,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5420081967213116,
+        "precision": 0.6803858520900321,
+        "recall": 0.4504044274159217,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8343351767251743,
+        "precision": 0.8141717503519474,
+        "recall": 0.8555226824457594,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9004323458767015,
+        "precision": 0.8590809093131264,
+        "recall": 0.9459659511472983,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389078242631,
+        "precision": 0.9991008541885209,
+        "recall": 0.9985770987793006,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8856789444749863,
+      "eval_loss": 0.28347474336624146,
       "eval_macro avg": {
+        "f1-score": 0.6254212866619178,
+        "precision": 0.76405734152864,
+        "recall": 0.629876554361031,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0448,
+      "eval_samples_per_second": 16.056,
+      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
+        "f1-score": 0.8748148382495958,
+        "precision": 0.8768575102351055,
+        "recall": 0.8856789444749863,
+        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.5137931034482759,
+        "precision": 0.6182572614107884,
+        "recall": 0.43952802359882004,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7622641509433963,
+        "precision": 0.9619047619047619,
+        "recall": 0.63125,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8853910477127397,
+        "precision": 0.8241758241758241,
+        "recall": 0.9564293304994687,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5413588470388762,
+        "precision": 0.6279853891542568,
+        "recall": 0.47573435504469985,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7949260042283298,
+        "precision": 0.856492027334852,
+        "recall": 0.7416173570019724,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9007064868336545,
+        "precision": 0.8614779777627618,
+        "recall": 0.9436780835744566,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389947942025,
+        "precision": 0.9990260713215463,
+        "recall": 0.9986519883172321,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8864211105002748,
+      "eval_loss": 0.2809496521949768,
       "eval_macro avg": {
+        "f1-score": 0.7710398049999251,
+        "precision": 0.8213313304378275,
+        "recall": 0.7409841625766643,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0579,
+      "eval_samples_per_second": 16.014,
+      "eval_steps_per_second": 2.175,
       "eval_weighted avg": {
+        "f1-score": 0.8798131143596267,
+        "precision": 0.8787439244541853,
+        "recall": 0.8864211105002748,
+        "support": 36380.0
       },
       "step": 162
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 286688514798000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-162/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2f0bdafd19c0347fe87a3f27a2ea54a847df1f75da4e3bbd7bf587c614e2949
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:db3de2ea286aed4cce53d86abf84d503faba79a292e98a5c89e444e2125b5ea5
 size 4920