Training in progress, epoch 3, checkpoint

Browse files

Files changed (5) hide show

checkpoint-243/model.safetensors +1 -1
checkpoint-243/optimizer.pt +1 -1
checkpoint-243/rng_state.pth +1 -1
checkpoint-243/trainer_state.json +127 -127
checkpoint-243/training_args.bin +1 -1

checkpoint-243/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22a395c8688b2f15641b9d851d1f19db884734f542205ce02a4d3fae582db8b6
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:71619f75212984822424498b5ac69981a254fa558d304cc020365c00147f41e3
 size 592330980

checkpoint-243/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e0eb853b714237fe5c62fd7c09d35f22f4a04d96c21b4523401fc2464aa379d2
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:3e2d4f952aab4cc4283b73dd02db181f0a445932e628f5ff99d79d7885af15b6
 size 1014670074

checkpoint-243/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:becd6836611c76f35df7d32580a0d0ecb16ccf6774d717a60f2504beb710244c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:4510120abb9e19965e0fc90a9342c8b839c7b334c4b005e1a74bbda01d4f51cc
 size 14244

checkpoint-243/trainer_state.json CHANGED Viewed

@@ -11,189 +11,189 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.18764302059496568,
-        "precision": 0.3416666666666667,
-        "recall": 0.12933753943217666,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.19540229885057472,
-        "precision": 0.8947368421052632,
-        "recall": 0.10967741935483871,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8476339053562143,
-        "precision": 0.740909090909091,
-        "recall": 0.9902794653705954,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.4315998169894769,
-        "precision": 0.6394035246272028,
-        "recall": 0.3257366482504604,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.7779799818016379,
-        "precision": 0.7493426818580193,
-        "recall": 0.8088930936613056,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8948683715038855,
-        "precision": 0.8376057421174058,
-        "recall": 0.9605350187403542,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9980147987727848,
-        "precision": 0.9970251509961237,
-        "recall": 0.9990064131514769,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8673183065585397,
-      "eval_loss": 0.3193369209766388,
       "eval_macro avg": {
-        "f1-score": 0.6190203134099342,
-        "precision": 0.7429556713256817,
-        "recall": 0.6176379425658869,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9083,
-      "eval_samples_per_second": 16.299,
-      "eval_steps_per_second": 2.037,
       "eval_weighted avg": {
-        "f1-score": 0.8489527906249091,
-        "precision": 0.8526967051825685,
-        "recall": 0.8673183065585397,
-        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.583941605839416,
-        "precision": 0.6926406926406926,
-        "recall": 0.5047318611987381,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8117647058823529,
-        "precision": 0.745945945945946,
-        "recall": 0.8903225806451613,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8943661971830986,
-        "precision": 0.8649262202043133,
-        "recall": 0.9258809234507898,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6197740770932805,
-        "precision": 0.6271506009898656,
-        "recall": 0.6125690607734806,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8298737427776589,
-        "precision": 0.7577178585384916,
-        "recall": 0.9172185430463576,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9013697613125952,
-        "precision": 0.9106660666066607,
-        "recall": 0.8922613360770192,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9961487925331883,
-        "precision": 0.9993636363636363,
-        "recall": 0.9929545659831993,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.887854213561099,
-      "eval_loss": 0.26407390832901,
       "eval_macro avg": {
-        "f1-score": 0.8053198403745129,
-        "precision": 0.7997730030413723,
-        "recall": 0.8194198387392494,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9329,
-      "eval_samples_per_second": 16.218,
-      "eval_steps_per_second": 2.027,
       "eval_weighted avg": {
-        "f1-score": 0.8876368199002541,
-        "precision": 0.8889201304482091,
-        "recall": 0.887854213561099,
-        "support": 32431.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
-        "f1-score": 0.5895522388059701,
-        "precision": 0.7214611872146118,
-        "recall": 0.49842271293375395,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8668941979522183,
-        "precision": 0.9202898550724637,
-        "recall": 0.8193548387096774,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8929178470254956,
-        "precision": 0.8365180467091295,
-        "recall": 0.9574726609963548,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6548140728684112,
-        "precision": 0.7178149876475433,
-        "recall": 0.6019797421731123,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8815622622368754,
-        "precision": 0.9502460360852925,
-        "recall": 0.8221381267738883,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9169943670953343,
-        "precision": 0.8852257181942544,
-        "recall": 0.9511280958330272,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9984170774727511,
-        "precision": 0.9998188405797102,
-        "recall": 0.9970192394544305,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9067250470229101,
-      "eval_loss": 0.25323203206062317,
       "eval_macro avg": {
-        "f1-score": 0.8287360090652937,
-        "precision": 0.8616249530718579,
-        "recall": 0.8067879166963207,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9025,
-      "eval_samples_per_second": 16.318,
-      "eval_steps_per_second": 2.04,
       "eval_weighted avg": {
-        "f1-score": 0.9033110548907601,
-        "precision": 0.9034896128542845,
-        "recall": 0.9067250470229101,
-        "support": 32431.0
       },
       "step": 243
     }
@@ -203,7 +203,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 431372438154000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.17153996101364524,
+        "precision": 0.25287356321839083,
+        "recall": 0.12979351032448377,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.08383233532934131,
+        "precision": 1.0,
+        "recall": 0.04375,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8469620831429876,
+        "precision": 0.7427884615384616,
+        "recall": 0.9851222104144527,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5420081967213116,
+        "precision": 0.6803858520900321,
+        "recall": 0.4504044274159217,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8343351767251743,
+        "precision": 0.8141717503519474,
+        "recall": 0.8555226824457594,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9004323458767015,
+        "precision": 0.8590809093131264,
+        "recall": 0.9459659511472983,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389078242631,
+        "precision": 0.9991008541885209,
+        "recall": 0.9985770987793006,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8856789444749863,
+      "eval_loss": 0.28347474336624146,
       "eval_macro avg": {
+        "f1-score": 0.6254212866619178,
+        "precision": 0.76405734152864,
+        "recall": 0.629876554361031,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0448,
+      "eval_samples_per_second": 16.056,
+      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
+        "f1-score": 0.8748148382495958,
+        "precision": 0.8768575102351055,
+        "recall": 0.8856789444749863,
+        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.5137931034482759,
+        "precision": 0.6182572614107884,
+        "recall": 0.43952802359882004,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7622641509433963,
+        "precision": 0.9619047619047619,
+        "recall": 0.63125,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8853910477127397,
+        "precision": 0.8241758241758241,
+        "recall": 0.9564293304994687,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5413588470388762,
+        "precision": 0.6279853891542568,
+        "recall": 0.47573435504469985,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7949260042283298,
+        "precision": 0.856492027334852,
+        "recall": 0.7416173570019724,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9007064868336545,
+        "precision": 0.8614779777627618,
+        "recall": 0.9436780835744566,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389947942025,
+        "precision": 0.9990260713215463,
+        "recall": 0.9986519883172321,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8864211105002748,
+      "eval_loss": 0.2809496521949768,
       "eval_macro avg": {
+        "f1-score": 0.7710398049999251,
+        "precision": 0.8213313304378275,
+        "recall": 0.7409841625766643,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0579,
+      "eval_samples_per_second": 16.014,
+      "eval_steps_per_second": 2.175,
       "eval_weighted avg": {
+        "f1-score": 0.8798131143596267,
+        "precision": 0.8787439244541853,
+        "recall": 0.8864211105002748,
+        "support": 36380.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
+        "f1-score": 0.6401137980085349,
+        "precision": 0.6181318681318682,
+        "recall": 0.6637168141592921,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7918781725888324,
+        "precision": 0.6666666666666666,
+        "recall": 0.975,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8866442199775534,
+        "precision": 0.93935790725327,
+        "recall": 0.8395324123273114,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6254390633315594,
+        "precision": 0.6255056418990845,
+        "recall": 0.6253724989357173,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.76480605487228,
+        "precision": 0.6205096714768191,
+        "recall": 0.9965483234714004,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9049205625504156,
+        "precision": 0.9449897450922942,
+        "recall": 0.868111163447951,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988758992805756,
+        "precision": 0.9995500562429697,
+        "recall": 0.9982026510896428,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8894997251236944,
+      "eval_loss": 0.318760484457016,
       "eval_macro avg": {
+        "f1-score": 0.8018111100871074,
+        "precision": 0.7735302223947104,
+        "recall": 0.852354837633045,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0862,
+      "eval_samples_per_second": 15.925,
+      "eval_steps_per_second": 2.163,
       "eval_weighted avg": {
+        "f1-score": 0.8920666591013163,
+        "precision": 0.9012548868310761,
+        "recall": 0.8894997251236944,
+        "support": 36380.0
       },
       "step": 243
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 430032772197000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-243/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2f0bdafd19c0347fe87a3f27a2ea54a847df1f75da4e3bbd7bf587c614e2949
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:db3de2ea286aed4cce53d86abf84d503faba79a292e98a5c89e444e2125b5ea5
 size 4920