Training in progress, epoch 3, checkpoint

Browse files

Files changed (5) hide show

checkpoint-243/model.safetensors +1 -1
checkpoint-243/optimizer.pt +1 -1
checkpoint-243/rng_state.pth +1 -1
checkpoint-243/trainer_state.json +127 -127
checkpoint-243/training_args.bin +1 -1

checkpoint-243/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5ccf5abd52d31eb8212c683fc99ade2a5fc13921df7bfd19fe624dbf52c0e9ed
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:22a395c8688b2f15641b9d851d1f19db884734f542205ce02a4d3fae582db8b6
 size 592330980

checkpoint-243/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1aafa996cb75f23910d58e271ed7276a775817e0148945238a6483bf8025d48f
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0eb853b714237fe5c62fd7c09d35f22f4a04d96c21b4523401fc2464aa379d2
 size 1014670074

checkpoint-243/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4510120abb9e19965e0fc90a9342c8b839c7b334c4b005e1a74bbda01d4f51cc
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:becd6836611c76f35df7d32580a0d0ecb16ccf6774d717a60f2504beb710244c
 size 14244

checkpoint-243/trainer_state.json CHANGED Viewed

@@ -11,189 +11,189 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.32421052631578945,
-        "precision": 0.42777777777777776,
-        "recall": 0.26101694915254237,
-        "support": 295.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.192090395480226,
-        "precision": 0.8095238095238095,
-        "recall": 0.10897435897435898,
-        "support": 156.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8566265060240965,
-        "precision": 0.7620578778135049,
-        "recall": 0.9779917469050894,
-        "support": 727.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.5001390820584144,
-        "precision": 0.5900886117492615,
-        "recall": 0.43398503499879315,
-        "support": 4143.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.776470588235294,
-        "precision": 0.6649333766655834,
-        "recall": 0.93296853625171,
-        "support": 2193.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8861458374413376,
-        "precision": 0.8781460059402845,
-        "recall": 0.8942927644670858,
-        "support": 12563.0
       },
       "eval_O": {
-        "f1-score": 0.9987647926046939,
-        "precision": 0.9977708781147998,
-        "recall": 0.9997606892150607,
-        "support": 12536.0
       },
-      "eval_accuracy": 0.8713396498328887,
-      "eval_loss": 0.3092103600502014,
       "eval_macro avg": {
-        "f1-score": 0.647778246879979,
-        "precision": 0.732899762512146,
-        "recall": 0.6584271542806628,
-        "support": 32613.0
-      },
-      "eval_runtime": 4.965,
-      "eval_samples_per_second": 16.314,
-      "eval_steps_per_second": 2.215,
       "eval_weighted avg": {
-        "f1-score": 0.8639627599323451,
-        "precision": 0.8662078389010613,
-        "recall": 0.8713396498328887,
-        "support": 32613.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.6186291739894552,
-        "precision": 0.6423357664233577,
-        "recall": 0.5966101694915255,
-        "support": 295.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8113879003558718,
-        "precision": 0.912,
-        "recall": 0.7307692307692307,
-        "support": 156.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8871181938911022,
-        "precision": 0.8575096277278562,
-        "recall": 0.9188445667125172,
-        "support": 727.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.656253149249219,
-        "precision": 0.5633217993079584,
-        "recall": 0.7859039343470915,
-        "support": 4143.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8368159203980099,
-        "precision": 0.9206349206349206,
-        "recall": 0.7669858641130871,
-        "support": 2193.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8831027253668763,
-        "precision": 0.933020288827855,
-        "recall": 0.8382551938231314,
-        "support": 12563.0
       },
       "eval_O": {
-        "f1-score": 0.9998006141085457,
-        "precision": 0.9996013077107089,
-        "recall": 1.0,
-        "support": 12536.0
       },
-      "eval_accuracy": 0.8880814399165977,
-      "eval_loss": 0.2581149935722351,
       "eval_macro avg": {
-        "f1-score": 0.8133010967655829,
-        "precision": 0.8326319586618081,
-        "recall": 0.8053384227509405,
-        "support": 32613.0
-      },
-      "eval_runtime": 5.0296,
-      "eval_samples_per_second": 16.105,
-      "eval_steps_per_second": 2.187,
       "eval_weighted avg": {
-        "f1-score": 0.8933836566327042,
-        "precision": 0.9064023864086126,
-        "recall": 0.8880814399165977,
-        "support": 32613.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
-        "f1-score": 0.6576271186440678,
-        "precision": 0.6576271186440678,
-        "recall": 0.6576271186440678,
-        "support": 295.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8673139158576051,
-        "precision": 0.8758169934640523,
-        "recall": 0.8589743589743589,
-        "support": 156.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8838487972508591,
-        "precision": 0.8832417582417582,
-        "recall": 0.8844566712517193,
-        "support": 727.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6468460321049062,
-        "precision": 0.6083351052519669,
-        "recall": 0.6905623944001931,
-        "support": 4143.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8695855771482088,
-        "precision": 0.8936477382098171,
-        "recall": 0.8467852257181943,
-        "support": 2193.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8926256077795786,
-        "precision": 0.9090533960551291,
-        "recall": 0.8767810236408501,
-        "support": 12563.0
       },
       "eval_O": {
-        "f1-score": 0.9998803589232302,
-        "precision": 0.9997607464710104,
-        "recall": 1.0,
-        "support": 12536.0
       },
-      "eval_accuracy": 0.8965749854352559,
-      "eval_loss": 0.2399493306875229,
       "eval_macro avg": {
-        "f1-score": 0.8311039153869222,
-        "precision": 0.8324975509054003,
-        "recall": 0.8307409703756262,
-        "support": 32613.0
-      },
-      "eval_runtime": 5.0024,
-      "eval_samples_per_second": 16.192,
-      "eval_steps_per_second": 2.199,
       "eval_weighted avg": {
-        "f1-score": 0.8986385496019461,
-        "precision": 0.9016737059631544,
-        "recall": 0.8965749854352559,
-        "support": 32613.0
       },
       "step": 243
     }
@@ -203,7 +203,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 430032772197000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.18764302059496568,
+        "precision": 0.3416666666666667,
+        "recall": 0.12933753943217666,
+        "support": 317.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.19540229885057472,
+        "precision": 0.8947368421052632,
+        "recall": 0.10967741935483871,
+        "support": 155.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8476339053562143,
+        "precision": 0.740909090909091,
+        "recall": 0.9902794653705954,
+        "support": 823.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.4315998169894769,
+        "precision": 0.6394035246272028,
+        "recall": 0.3257366482504604,
+        "support": 4344.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7779799818016379,
+        "precision": 0.7493426818580193,
+        "recall": 0.8088930936613056,
+        "support": 2114.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.8948683715038855,
+        "precision": 0.8376057421174058,
+        "recall": 0.9605350187403542,
+        "support": 13607.0
       },
       "eval_O": {
+        "f1-score": 0.9980147987727848,
+        "precision": 0.9970251509961237,
+        "recall": 0.9990064131514769,
+        "support": 11071.0
       },
+      "eval_accuracy": 0.8673183065585397,
+      "eval_loss": 0.3193369209766388,
       "eval_macro avg": {
+        "f1-score": 0.6190203134099342,
+        "precision": 0.7429556713256817,
+        "recall": 0.6176379425658869,
+        "support": 32431.0
+      },
+      "eval_runtime": 4.9083,
+      "eval_samples_per_second": 16.299,
+      "eval_steps_per_second": 2.037,
       "eval_weighted avg": {
+        "f1-score": 0.8489527906249091,
+        "precision": 0.8526967051825685,
+        "recall": 0.8673183065585397,
+        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.583941605839416,
+        "precision": 0.6926406926406926,
+        "recall": 0.5047318611987381,
+        "support": 317.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8117647058823529,
+        "precision": 0.745945945945946,
+        "recall": 0.8903225806451613,
+        "support": 155.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8943661971830986,
+        "precision": 0.8649262202043133,
+        "recall": 0.9258809234507898,
+        "support": 823.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6197740770932805,
+        "precision": 0.6271506009898656,
+        "recall": 0.6125690607734806,
+        "support": 4344.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8298737427776589,
+        "precision": 0.7577178585384916,
+        "recall": 0.9172185430463576,
+        "support": 2114.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9013697613125952,
+        "precision": 0.9106660666066607,
+        "recall": 0.8922613360770192,
+        "support": 13607.0
       },
       "eval_O": {
+        "f1-score": 0.9961487925331883,
+        "precision": 0.9993636363636363,
+        "recall": 0.9929545659831993,
+        "support": 11071.0
       },
+      "eval_accuracy": 0.887854213561099,
+      "eval_loss": 0.26407390832901,
       "eval_macro avg": {
+        "f1-score": 0.8053198403745129,
+        "precision": 0.7997730030413723,
+        "recall": 0.8194198387392494,
+        "support": 32431.0
+      },
+      "eval_runtime": 4.9329,
+      "eval_samples_per_second": 16.218,
+      "eval_steps_per_second": 2.027,
       "eval_weighted avg": {
+        "f1-score": 0.8876368199002541,
+        "precision": 0.8889201304482091,
+        "recall": 0.887854213561099,
+        "support": 32431.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
+        "f1-score": 0.5895522388059701,
+        "precision": 0.7214611872146118,
+        "recall": 0.49842271293375395,
+        "support": 317.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8668941979522183,
+        "precision": 0.9202898550724637,
+        "recall": 0.8193548387096774,
+        "support": 155.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8929178470254956,
+        "precision": 0.8365180467091295,
+        "recall": 0.9574726609963548,
+        "support": 823.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6548140728684112,
+        "precision": 0.7178149876475433,
+        "recall": 0.6019797421731123,
+        "support": 4344.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8815622622368754,
+        "precision": 0.9502460360852925,
+        "recall": 0.8221381267738883,
+        "support": 2114.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9169943670953343,
+        "precision": 0.8852257181942544,
+        "recall": 0.9511280958330272,
+        "support": 13607.0
       },
       "eval_O": {
+        "f1-score": 0.9984170774727511,
+        "precision": 0.9998188405797102,
+        "recall": 0.9970192394544305,
+        "support": 11071.0
       },
+      "eval_accuracy": 0.9067250470229101,
+      "eval_loss": 0.25323203206062317,
       "eval_macro avg": {
+        "f1-score": 0.8287360090652937,
+        "precision": 0.8616249530718579,
+        "recall": 0.8067879166963207,
+        "support": 32431.0
+      },
+      "eval_runtime": 4.9025,
+      "eval_samples_per_second": 16.318,
+      "eval_steps_per_second": 2.04,
       "eval_weighted avg": {
+        "f1-score": 0.9033110548907601,
+        "precision": 0.9034896128542845,
+        "recall": 0.9067250470229101,
+        "support": 32431.0
       },
       "step": 243
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 431372438154000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-243/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5eff186592c44100b7fd5c301c21b9eebfc7f8bd335567cdc6ffe4a4d32ec927
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:f2f0bdafd19c0347fe87a3f27a2ea54a847df1f75da4e3bbd7bf587c614e2949
 size 4920