Training in progress, epoch 7, checkpoint

Browse files

Files changed (5) hide show

checkpoint-567/model.safetensors +1 -1
checkpoint-567/optimizer.pt +1 -1
checkpoint-567/rng_state.pth +1 -1
checkpoint-567/trainer_state.json +296 -296
checkpoint-567/training_args.bin +1 -1

checkpoint-567/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60412acb72f83fedb9248d0a7ee1769e52aa232b71b130b017c10f51d17e28ae
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:596824d28705696f937cd813ca7963f5f8f9cbf5ee6a9d7fe491a68f4d6fe2cb
 size 592330980

checkpoint-567/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87eafd7446cd1277f3cbabb568f8a4d97354f03981954188b2a1d29a53927da5
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:b376490aa83e6dbb9665168250ec42810c006985b6c9c75f4147bceebe2844d7
 size 1014670074

checkpoint-567/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a37c3795111d23ad6190712c2991585b141e7dd666ac9350ac9e35c845a45539
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:df74477c8049c831c537fb964d31e59ec8d12121ecfdafd2834f9022f29cfdc5
 size 14244

checkpoint-567/trainer_state.json CHANGED Viewed

@@ -11,448 +11,448 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.18764302059496568,
-        "precision": 0.3416666666666667,
-        "recall": 0.12933753943217666,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.19540229885057472,
-        "precision": 0.8947368421052632,
-        "recall": 0.10967741935483871,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8476339053562143,
-        "precision": 0.740909090909091,
-        "recall": 0.9902794653705954,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.4315998169894769,
-        "precision": 0.6394035246272028,
-        "recall": 0.3257366482504604,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.7779799818016379,
-        "precision": 0.7493426818580193,
-        "recall": 0.8088930936613056,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8948683715038855,
-        "precision": 0.8376057421174058,
-        "recall": 0.9605350187403542,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9980147987727848,
-        "precision": 0.9970251509961237,
-        "recall": 0.9990064131514769,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8673183065585397,
-      "eval_loss": 0.3193369209766388,
       "eval_macro avg": {
-        "f1-score": 0.6190203134099342,
-        "precision": 0.7429556713256817,
-        "recall": 0.6176379425658869,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9083,
-      "eval_samples_per_second": 16.299,
-      "eval_steps_per_second": 2.037,
       "eval_weighted avg": {
-        "f1-score": 0.8489527906249091,
-        "precision": 0.8526967051825685,
-        "recall": 0.8673183065585397,
-        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.583941605839416,
-        "precision": 0.6926406926406926,
-        "recall": 0.5047318611987381,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8117647058823529,
-        "precision": 0.745945945945946,
-        "recall": 0.8903225806451613,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8943661971830986,
-        "precision": 0.8649262202043133,
-        "recall": 0.9258809234507898,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6197740770932805,
-        "precision": 0.6271506009898656,
-        "recall": 0.6125690607734806,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8298737427776589,
-        "precision": 0.7577178585384916,
-        "recall": 0.9172185430463576,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9013697613125952,
-        "precision": 0.9106660666066607,
-        "recall": 0.8922613360770192,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9961487925331883,
-        "precision": 0.9993636363636363,
-        "recall": 0.9929545659831993,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.887854213561099,
-      "eval_loss": 0.26407390832901,
       "eval_macro avg": {
-        "f1-score": 0.8053198403745129,
-        "precision": 0.7997730030413723,
-        "recall": 0.8194198387392494,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9329,
-      "eval_samples_per_second": 16.218,
-      "eval_steps_per_second": 2.027,
       "eval_weighted avg": {
-        "f1-score": 0.8876368199002541,
-        "precision": 0.8889201304482091,
-        "recall": 0.887854213561099,
-        "support": 32431.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
-        "f1-score": 0.5895522388059701,
-        "precision": 0.7214611872146118,
-        "recall": 0.49842271293375395,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8668941979522183,
-        "precision": 0.9202898550724637,
-        "recall": 0.8193548387096774,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8929178470254956,
-        "precision": 0.8365180467091295,
-        "recall": 0.9574726609963548,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6548140728684112,
-        "precision": 0.7178149876475433,
-        "recall": 0.6019797421731123,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8815622622368754,
-        "precision": 0.9502460360852925,
-        "recall": 0.8221381267738883,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9169943670953343,
-        "precision": 0.8852257181942544,
-        "recall": 0.9511280958330272,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9984170774727511,
-        "precision": 0.9998188405797102,
-        "recall": 0.9970192394544305,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9067250470229101,
-      "eval_loss": 0.25323203206062317,
       "eval_macro avg": {
-        "f1-score": 0.8287360090652937,
-        "precision": 0.8616249530718579,
-        "recall": 0.8067879166963207,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9025,
-      "eval_samples_per_second": 16.318,
-      "eval_steps_per_second": 2.04,
       "eval_weighted avg": {
-        "f1-score": 0.9033110548907601,
-        "precision": 0.9034896128542845,
-        "recall": 0.9067250470229101,
-        "support": 32431.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_B-Claim": {
-        "f1-score": 0.6806136680613668,
-        "precision": 0.61,
-        "recall": 0.7697160883280757,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8861538461538462,
-        "precision": 0.8470588235294118,
-        "recall": 0.9290322580645162,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8687258687258688,
-        "precision": 0.9233926128590971,
-        "recall": 0.8201701093560145,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.656155854589275,
-        "precision": 0.5819380121125757,
-        "recall": 0.7520718232044199,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8818897637795275,
-        "precision": 0.8408408408408409,
-        "recall": 0.9271523178807947,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8829758349171871,
-        "precision": 0.9349433218334154,
-        "recall": 0.836481222899978,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9971017118014671,
-        "precision": 0.9998183634547271,
-        "recall": 0.9943997832174148,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8843698930036077,
-      "eval_loss": 0.2791365385055542,
       "eval_macro avg": {
-        "f1-score": 0.8362309354326484,
-        "precision": 0.8197131392328668,
-        "recall": 0.8612890861358877,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9234,
-      "eval_samples_per_second": 16.249,
-      "eval_steps_per_second": 2.031,
       "eval_weighted avg": {
-        "f1-score": 0.889158243622726,
-        "precision": 0.8997827813567029,
-        "recall": 0.8843698930036077,
-        "support": 32431.0
       },
       "step": 324
     },
     {
       "epoch": 5.0,
       "eval_B-Claim": {
-        "f1-score": 0.6078799249530958,
-        "precision": 0.75,
-        "recall": 0.5110410094637224,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8971962616822431,
-        "precision": 0.8674698795180723,
-        "recall": 0.9290322580645162,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.893739230327398,
-        "precision": 0.8474945533769063,
-        "recall": 0.945321992709599,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6119813135476778,
-        "precision": 0.7590320381731425,
-        "recall": 0.5126611418047882,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8889393595275948,
-        "precision": 0.854958497160332,
-        "recall": 0.9257332071901608,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9137743463765573,
-        "precision": 0.874462654486835,
-        "recall": 0.956786947894466,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9976913675252366,
-        "precision": 1.0,
-        "recall": 0.9953933700659381,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9036724121982054,
-      "eval_loss": 0.3500836193561554,
       "eval_macro avg": {
-        "f1-score": 0.8301716862771149,
-        "precision": 0.8504882318164697,
-        "recall": 0.8251385610275985,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9239,
-      "eval_samples_per_second": 16.247,
-      "eval_steps_per_second": 2.031,
       "eval_weighted avg": {
-        "f1-score": 0.8968007164885599,
-        "precision": 0.8986502613295283,
-        "recall": 0.9036724121982054,
-        "support": 32431.0
       },
       "step": 405
     },
     {
       "epoch": 6.0,
       "eval_B-Claim": {
-        "f1-score": 0.672077922077922,
-        "precision": 0.6923076923076923,
-        "recall": 0.6529968454258676,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8910256410256411,
-        "precision": 0.8853503184713376,
-        "recall": 0.896774193548387,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8907563025210083,
-        "precision": 0.8801897983392646,
-        "recall": 0.9015795868772782,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6666666666666667,
-        "precision": 0.6998228296633764,
-        "recall": 0.6365101289134438,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8853370396108408,
-        "precision": 0.867453472537449,
-        "recall": 0.9039735099337748,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9098497495826378,
-        "precision": 0.8987595898759589,
-        "recall": 0.9212170206511354,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.998190209030857,
-        "precision": 1.0,
-        "recall": 0.9963869569144612,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9043816101877833,
-      "eval_loss": 0.30672115087509155,
       "eval_macro avg": {
-        "f1-score": 0.8448433615022248,
-        "precision": 0.8462691001707254,
-        "recall": 0.8442054631806213,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9018,
-      "eval_samples_per_second": 16.321,
-      "eval_steps_per_second": 2.04,
       "eval_weighted avg": {
-        "f1-score": 0.9029367568413356,
-        "precision": 0.9020793621628027,
-        "recall": 0.9043816101877833,
-        "support": 32431.0
       },
       "step": 486
     },
     {
       "epoch": 6.17,
-      "grad_norm": 0.43724608421325684,
       "learning_rate": 1.7530864197530865e-05,
-      "loss": 0.2434,
       "step": 500
     },
     {
       "epoch": 7.0,
       "eval_B-Claim": {
-        "f1-score": 0.6763285024154589,
-        "precision": 0.6907894736842105,
-        "recall": 0.6624605678233438,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8952380952380952,
-        "precision": 0.88125,
-        "recall": 0.9096774193548387,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8941034897713597,
-        "precision": 0.8855780691299165,
-        "recall": 0.9027946537059538,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6960393719240684,
-        "precision": 0.7088305489260143,
-        "recall": 0.6837016574585635,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.9140037593984962,
-        "precision": 0.9080298786181139,
-        "recall": 0.9200567644276254,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9164355568530141,
-        "precision": 0.9101253895774444,
-        "recall": 0.9228338355258323,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9967376529225193,
         "precision": 1.0,
-        "recall": 0.9934965224460302,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9116277635595572,
-      "eval_loss": 0.34577852487564087,
       "eval_macro avg": {
-        "f1-score": 0.855555204074716,
-        "precision": 0.8549433371336713,
-        "recall": 0.8564316315345982,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.8989,
-      "eval_samples_per_second": 16.33,
-      "eval_steps_per_second": 2.041,
       "eval_weighted avg": {
-        "f1-score": 0.9111536914902465,
-        "precision": 0.910801887328957,
-        "recall": 0.9116277635595572,
-        "support": 32431.0
       },
       "step": 567
     }
@@ -462,7 +462,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 1006535689026000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.17153996101364524,
+        "precision": 0.25287356321839083,
+        "recall": 0.12979351032448377,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.08383233532934131,
+        "precision": 1.0,
+        "recall": 0.04375,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8469620831429876,
+        "precision": 0.7427884615384616,
+        "recall": 0.9851222104144527,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5420081967213116,
+        "precision": 0.6803858520900321,
+        "recall": 0.4504044274159217,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8343351767251743,
+        "precision": 0.8141717503519474,
+        "recall": 0.8555226824457594,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9004323458767015,
+        "precision": 0.8590809093131264,
+        "recall": 0.9459659511472983,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389078242631,
+        "precision": 0.9991008541885209,
+        "recall": 0.9985770987793006,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8856789444749863,
+      "eval_loss": 0.28347474336624146,
       "eval_macro avg": {
+        "f1-score": 0.6254212866619178,
+        "precision": 0.76405734152864,
+        "recall": 0.629876554361031,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0448,
+      "eval_samples_per_second": 16.056,
+      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
+        "f1-score": 0.8748148382495958,
+        "precision": 0.8768575102351055,
+        "recall": 0.8856789444749863,
+        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.5137931034482759,
+        "precision": 0.6182572614107884,
+        "recall": 0.43952802359882004,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7622641509433963,
+        "precision": 0.9619047619047619,
+        "recall": 0.63125,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8853910477127397,
+        "precision": 0.8241758241758241,
+        "recall": 0.9564293304994687,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5413588470388762,
+        "precision": 0.6279853891542568,
+        "recall": 0.47573435504469985,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7949260042283298,
+        "precision": 0.856492027334852,
+        "recall": 0.7416173570019724,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9007064868336545,
+        "precision": 0.8614779777627618,
+        "recall": 0.9436780835744566,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389947942025,
+        "precision": 0.9990260713215463,
+        "recall": 0.9986519883172321,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8864211105002748,
+      "eval_loss": 0.2809496521949768,
       "eval_macro avg": {
+        "f1-score": 0.7710398049999251,
+        "precision": 0.8213313304378275,
+        "recall": 0.7409841625766643,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0579,
+      "eval_samples_per_second": 16.014,
+      "eval_steps_per_second": 2.175,
       "eval_weighted avg": {
+        "f1-score": 0.8798131143596267,
+        "precision": 0.8787439244541853,
+        "recall": 0.8864211105002748,
+        "support": 36380.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
+        "f1-score": 0.6401137980085349,
+        "precision": 0.6181318681318682,
+        "recall": 0.6637168141592921,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7918781725888324,
+        "precision": 0.6666666666666666,
+        "recall": 0.975,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8866442199775534,
+        "precision": 0.93935790725327,
+        "recall": 0.8395324123273114,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6254390633315594,
+        "precision": 0.6255056418990845,
+        "recall": 0.6253724989357173,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.76480605487228,
+        "precision": 0.6205096714768191,
+        "recall": 0.9965483234714004,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9049205625504156,
+        "precision": 0.9449897450922942,
+        "recall": 0.868111163447951,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988758992805756,
+        "precision": 0.9995500562429697,
+        "recall": 0.9982026510896428,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8894997251236944,
+      "eval_loss": 0.318760484457016,
       "eval_macro avg": {
+        "f1-score": 0.8018111100871074,
+        "precision": 0.7735302223947104,
+        "recall": 0.852354837633045,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0862,
+      "eval_samples_per_second": 15.925,
+      "eval_steps_per_second": 2.163,
       "eval_weighted avg": {
+        "f1-score": 0.8920666591013163,
+        "precision": 0.9012548868310761,
+        "recall": 0.8894997251236944,
+        "support": 36380.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_B-Claim": {
+        "f1-score": 0.7034883720930232,
+        "precision": 0.6934097421203438,
+        "recall": 0.7138643067846607,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8958990536277602,
+        "precision": 0.9044585987261147,
+        "recall": 0.8875,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.9051172707889126,
+        "precision": 0.9080213903743316,
+        "recall": 0.9022316684378321,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6932699265998139,
+        "precision": 0.6739698492462312,
+        "recall": 0.7137079608343976,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8904009720534629,
+        "precision": 0.877815045519885,
+        "recall": 0.903353057199211,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9127480293558032,
+        "precision": 0.9218310342461052,
+        "recall": 0.9038422717179194,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9981619715668254,
+        "precision": 0.9999248459341651,
+        "recall": 0.9964053021792856,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.9113523914238593,
+      "eval_loss": 0.2517726719379425,
       "eval_macro avg": {
+        "f1-score": 0.8570122280122289,
+        "precision": 0.8542043580238825,
+        "recall": 0.8601292238790438,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.062,
+      "eval_samples_per_second": 16.002,
+      "eval_steps_per_second": 2.173,
       "eval_weighted avg": {
+        "f1-score": 0.9122886837716081,
+        "precision": 0.9134709768686261,
+        "recall": 0.9113523914238593,
+        "support": 36380.0
       },
       "step": 324
     },
     {
       "epoch": 5.0,
       "eval_B-Claim": {
+        "f1-score": 0.6590538336052201,
+        "precision": 0.7372262773722628,
+        "recall": 0.5958702064896755,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.9078947368421054,
+        "precision": 0.9583333333333334,
+        "recall": 0.8625,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.9066802651708312,
+        "precision": 0.8715686274509804,
+        "recall": 0.944739638682253,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6513589503280225,
+        "precision": 0.7243355914538823,
+        "recall": 0.5917411664538101,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8981975120588981,
+        "precision": 0.9256933542647828,
+        "recall": 0.8722879684418146,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9158848058378942,
+        "precision": 0.8877170824123777,
+        "recall": 0.9458986609245676,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9994384336041331,
+        "precision": 0.9992513849378649,
+        "recall": 0.9996255523103422,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.9121220450797142,
+      "eval_loss": 0.2739432156085968,
       "eval_macro avg": {
+        "f1-score": 0.8483583624924435,
+        "precision": 0.8720179501750691,
+        "recall": 0.8303804561860663,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0932,
+      "eval_samples_per_second": 15.904,
+      "eval_steps_per_second": 2.16,
       "eval_weighted avg": {
+        "f1-score": 0.9087400479269403,
+        "precision": 0.9081638580455985,
+        "recall": 0.9121220450797142,
+        "support": 36380.0
       },
       "step": 405
     },
     {
       "epoch": 6.0,
       "eval_B-Claim": {
+        "f1-score": 0.6675461741424802,
+        "precision": 0.60381861575179,
+        "recall": 0.7463126843657817,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.887608069164265,
+        "precision": 0.8235294117647058,
+        "recall": 0.9625,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8737316798196167,
+        "precision": 0.9303721488595438,
+        "recall": 0.8235919234856536,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6529236868186323,
+        "precision": 0.6109050445103857,
+        "recall": 0.7011494252873564,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8689320388349515,
+        "precision": 0.7863418530351438,
+        "recall": 0.9709072978303748,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.8937734066010992,
+        "precision": 0.9312910284463894,
+        "recall": 0.8591615638247763,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988009592326139,
+        "precision": 0.9994750656167979,
+        "recall": 0.9981277615517112,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8944749862561847,
+      "eval_loss": 0.37784042954444885,
       "eval_macro avg": {
+        "f1-score": 0.8347594306590942,
+        "precision": 0.8122475954263937,
+        "recall": 0.8659643794779507,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0734,
+      "eval_samples_per_second": 15.966,
+      "eval_steps_per_second": 2.168,
       "eval_weighted avg": {
+        "f1-score": 0.8971820344797716,
+        "precision": 0.9033144340485707,
+        "recall": 0.8944749862561847,
+        "support": 36380.0
       },
       "step": 486
     },
     {
       "epoch": 6.17,
+      "grad_norm": 21.778270721435547,
       "learning_rate": 1.7530864197530865e-05,
+      "loss": 0.2481,
       "step": 500
     },
     {
       "epoch": 7.0,
       "eval_B-Claim": {
+        "f1-score": 0.6489859594383774,
+        "precision": 0.6887417218543046,
+        "recall": 0.6135693215339233,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8852459016393444,
+        "precision": 0.9310344827586207,
+        "recall": 0.84375,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.9011898603207449,
+        "precision": 0.8780241935483871,
+        "recall": 0.9256110520722636,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.626564114338193,
+        "precision": 0.6800398704211313,
+        "recall": 0.5808854831843338,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8813559322033898,
+        "precision": 0.9049350649350649,
+        "recall": 0.8589743589743589,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9073595340161655,
+        "precision": 0.8831698305516626,
+        "recall": 0.9329116479375547,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9981994148098132,
         "precision": 1.0,
+        "recall": 0.9964053021792856,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.9030786146234194,
+      "eval_loss": 0.4109443426132202,
       "eval_macro avg": {
+        "f1-score": 0.8355572452522898,
+        "precision": 0.8522778805813102,
+        "recall": 0.8217295951259599,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0454,
+      "eval_samples_per_second": 16.054,
+      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
+        "f1-score": 0.9003265559019435,
+        "precision": 0.8992988510674564,
+        "recall": 0.9030786146234194,
+        "support": 36380.0
       },
       "step": 567
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 1003409801793000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-567/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2f0bdafd19c0347fe87a3f27a2ea54a847df1f75da4e3bbd7bf587c614e2949
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:db3de2ea286aed4cce53d86abf84d503faba79a292e98a5c89e444e2125b5ea5
 size 4920