Training in progress, epoch 4, checkpoint

Browse files

Files changed (5) hide show

checkpoint-324/model.safetensors +1 -1
checkpoint-324/optimizer.pt +1 -1
checkpoint-324/rng_state.pth +1 -1
checkpoint-324/trainer_state.json +169 -169
checkpoint-324/training_args.bin +1 -1

checkpoint-324/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84582d16cd14917094cb79e6f68d08448699f975dfbd65567cc572c4e7bffaec
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6e87fc8414c8d116aca90295f7c1d4dbd4f949f3d1504f5f6b352e86b77e106
 size 592330980

checkpoint-324/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af8de27c8e39c474161123029eb57f6e409ea9680024a81243b93d16b3b573b6
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:67e883f786c5b99a6682f06b1f61aa62efc57096962bdb14211f553a3793d81e
 size 1014670074

checkpoint-324/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5474bfb178f1f5ac14d6be6fd7772f757be3e1728e1b25f0f54ac7eff70dac62
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd95f0f86efa354df6a4222f1c9e390b588b8fcd802633d848de21a27eedcb23
 size 14244

checkpoint-324/trainer_state.json CHANGED Viewed

@@ -11,252 +11,252 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.18764302059496568,
-        "precision": 0.3416666666666667,
-        "recall": 0.12933753943217666,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.19540229885057472,
-        "precision": 0.8947368421052632,
-        "recall": 0.10967741935483871,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8476339053562143,
-        "precision": 0.740909090909091,
-        "recall": 0.9902794653705954,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.4315998169894769,
-        "precision": 0.6394035246272028,
-        "recall": 0.3257366482504604,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.7779799818016379,
-        "precision": 0.7493426818580193,
-        "recall": 0.8088930936613056,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8948683715038855,
-        "precision": 0.8376057421174058,
-        "recall": 0.9605350187403542,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9980147987727848,
-        "precision": 0.9970251509961237,
-        "recall": 0.9990064131514769,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8673183065585397,
-      "eval_loss": 0.3193369209766388,
       "eval_macro avg": {
-        "f1-score": 0.6190203134099342,
-        "precision": 0.7429556713256817,
-        "recall": 0.6176379425658869,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9083,
-      "eval_samples_per_second": 16.299,
-      "eval_steps_per_second": 2.037,
       "eval_weighted avg": {
-        "f1-score": 0.8489527906249091,
-        "precision": 0.8526967051825685,
-        "recall": 0.8673183065585397,
-        "support": 32431.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.583941605839416,
-        "precision": 0.6926406926406926,
-        "recall": 0.5047318611987381,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8117647058823529,
-        "precision": 0.745945945945946,
-        "recall": 0.8903225806451613,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8943661971830986,
-        "precision": 0.8649262202043133,
-        "recall": 0.9258809234507898,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6197740770932805,
-        "precision": 0.6271506009898656,
-        "recall": 0.6125690607734806,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8298737427776589,
-        "precision": 0.7577178585384916,
-        "recall": 0.9172185430463576,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9013697613125952,
-        "precision": 0.9106660666066607,
-        "recall": 0.8922613360770192,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9961487925331883,
-        "precision": 0.9993636363636363,
-        "recall": 0.9929545659831993,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.887854213561099,
-      "eval_loss": 0.26407390832901,
       "eval_macro avg": {
-        "f1-score": 0.8053198403745129,
-        "precision": 0.7997730030413723,
-        "recall": 0.8194198387392494,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9329,
-      "eval_samples_per_second": 16.218,
-      "eval_steps_per_second": 2.027,
       "eval_weighted avg": {
-        "f1-score": 0.8876368199002541,
-        "precision": 0.8889201304482091,
-        "recall": 0.887854213561099,
-        "support": 32431.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
-        "f1-score": 0.5895522388059701,
-        "precision": 0.7214611872146118,
-        "recall": 0.49842271293375395,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8668941979522183,
-        "precision": 0.9202898550724637,
-        "recall": 0.8193548387096774,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8929178470254956,
-        "precision": 0.8365180467091295,
-        "recall": 0.9574726609963548,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6548140728684112,
-        "precision": 0.7178149876475433,
-        "recall": 0.6019797421731123,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8815622622368754,
-        "precision": 0.9502460360852925,
-        "recall": 0.8221381267738883,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9169943670953343,
-        "precision": 0.8852257181942544,
-        "recall": 0.9511280958330272,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9984170774727511,
-        "precision": 0.9998188405797102,
-        "recall": 0.9970192394544305,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.9067250470229101,
-      "eval_loss": 0.25323203206062317,
       "eval_macro avg": {
-        "f1-score": 0.8287360090652937,
-        "precision": 0.8616249530718579,
-        "recall": 0.8067879166963207,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9025,
-      "eval_samples_per_second": 16.318,
-      "eval_steps_per_second": 2.04,
       "eval_weighted avg": {
-        "f1-score": 0.9033110548907601,
-        "precision": 0.9034896128542845,
-        "recall": 0.9067250470229101,
-        "support": 32431.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_B-Claim": {
-        "f1-score": 0.6806136680613668,
-        "precision": 0.61,
-        "recall": 0.7697160883280757,
-        "support": 317.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.8861538461538462,
-        "precision": 0.8470588235294118,
-        "recall": 0.9290322580645162,
-        "support": 155.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8687258687258688,
-        "precision": 0.9233926128590971,
-        "recall": 0.8201701093560145,
-        "support": 823.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.656155854589275,
-        "precision": 0.5819380121125757,
-        "recall": 0.7520718232044199,
-        "support": 4344.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8818897637795275,
-        "precision": 0.8408408408408409,
-        "recall": 0.9271523178807947,
-        "support": 2114.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.8829758349171871,
-        "precision": 0.9349433218334154,
-        "recall": 0.836481222899978,
-        "support": 13607.0
       },
       "eval_O": {
-        "f1-score": 0.9971017118014671,
-        "precision": 0.9998183634547271,
-        "recall": 0.9943997832174148,
-        "support": 11071.0
       },
-      "eval_accuracy": 0.8843698930036077,
-      "eval_loss": 0.2791365385055542,
       "eval_macro avg": {
-        "f1-score": 0.8362309354326484,
-        "precision": 0.8197131392328668,
-        "recall": 0.8612890861358877,
-        "support": 32431.0
-      },
-      "eval_runtime": 4.9234,
-      "eval_samples_per_second": 16.249,
-      "eval_steps_per_second": 2.031,
       "eval_weighted avg": {
-        "f1-score": 0.889158243622726,
-        "precision": 0.8997827813567029,
-        "recall": 0.8843698930036077,
-        "support": 32431.0
       },
       "step": 324
     }
@@ -266,7 +266,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 575163250872000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.17153996101364524,
+        "precision": 0.25287356321839083,
+        "recall": 0.12979351032448377,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.08383233532934131,
+        "precision": 1.0,
+        "recall": 0.04375,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8469620831429876,
+        "precision": 0.7427884615384616,
+        "recall": 0.9851222104144527,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5420081967213116,
+        "precision": 0.6803858520900321,
+        "recall": 0.4504044274159217,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8343351767251743,
+        "precision": 0.8141717503519474,
+        "recall": 0.8555226824457594,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9004323458767015,
+        "precision": 0.8590809093131264,
+        "recall": 0.9459659511472983,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389078242631,
+        "precision": 0.9991008541885209,
+        "recall": 0.9985770987793006,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8856789444749863,
+      "eval_loss": 0.28347474336624146,
       "eval_macro avg": {
+        "f1-score": 0.6254212866619178,
+        "precision": 0.76405734152864,
+        "recall": 0.629876554361031,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0448,
+      "eval_samples_per_second": 16.056,
+      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
+        "f1-score": 0.8748148382495958,
+        "precision": 0.8768575102351055,
+        "recall": 0.8856789444749863,
+        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.5137931034482759,
+        "precision": 0.6182572614107884,
+        "recall": 0.43952802359882004,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7622641509433963,
+        "precision": 0.9619047619047619,
+        "recall": 0.63125,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8853910477127397,
+        "precision": 0.8241758241758241,
+        "recall": 0.9564293304994687,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5413588470388762,
+        "precision": 0.6279853891542568,
+        "recall": 0.47573435504469985,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7949260042283298,
+        "precision": 0.856492027334852,
+        "recall": 0.7416173570019724,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9007064868336545,
+        "precision": 0.8614779777627618,
+        "recall": 0.9436780835744566,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988389947942025,
+        "precision": 0.9990260713215463,
+        "recall": 0.9986519883172321,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8864211105002748,
+      "eval_loss": 0.2809496521949768,
       "eval_macro avg": {
+        "f1-score": 0.7710398049999251,
+        "precision": 0.8213313304378275,
+        "recall": 0.7409841625766643,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0579,
+      "eval_samples_per_second": 16.014,
+      "eval_steps_per_second": 2.175,
       "eval_weighted avg": {
+        "f1-score": 0.8798131143596267,
+        "precision": 0.8787439244541853,
+        "recall": 0.8864211105002748,
+        "support": 36380.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
+        "f1-score": 0.6401137980085349,
+        "precision": 0.6181318681318682,
+        "recall": 0.6637168141592921,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.7918781725888324,
+        "precision": 0.6666666666666666,
+        "recall": 0.975,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8866442199775534,
+        "precision": 0.93935790725327,
+        "recall": 0.8395324123273114,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6254390633315594,
+        "precision": 0.6255056418990845,
+        "recall": 0.6253724989357173,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.76480605487228,
+        "precision": 0.6205096714768191,
+        "recall": 0.9965483234714004,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9049205625504156,
+        "precision": 0.9449897450922942,
+        "recall": 0.868111163447951,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9988758992805756,
+        "precision": 0.9995500562429697,
+        "recall": 0.9982026510896428,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.8894997251236944,
+      "eval_loss": 0.318760484457016,
       "eval_macro avg": {
+        "f1-score": 0.8018111100871074,
+        "precision": 0.7735302223947104,
+        "recall": 0.852354837633045,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.0862,
+      "eval_samples_per_second": 15.925,
+      "eval_steps_per_second": 2.163,
       "eval_weighted avg": {
+        "f1-score": 0.8920666591013163,
+        "precision": 0.9012548868310761,
+        "recall": 0.8894997251236944,
+        "support": 36380.0
       },
       "step": 243
     },
     {
       "epoch": 4.0,
       "eval_B-Claim": {
+        "f1-score": 0.7034883720930232,
+        "precision": 0.6934097421203438,
+        "recall": 0.7138643067846607,
+        "support": 339.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8958990536277602,
+        "precision": 0.9044585987261147,
+        "recall": 0.8875,
+        "support": 160.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.9051172707889126,
+        "precision": 0.9080213903743316,
+        "recall": 0.9022316684378321,
+        "support": 941.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.6932699265998139,
+        "precision": 0.6739698492462312,
+        "recall": 0.7137079608343976,
+        "support": 4698.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8904009720534629,
+        "precision": 0.877815045519885,
+        "recall": 0.903353057199211,
+        "support": 2028.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.9127480293558032,
+        "precision": 0.9218310342461052,
+        "recall": 0.9038422717179194,
+        "support": 14861.0
       },
       "eval_O": {
+        "f1-score": 0.9981619715668254,
+        "precision": 0.9999248459341651,
+        "recall": 0.9964053021792856,
+        "support": 13353.0
       },
+      "eval_accuracy": 0.9113523914238593,
+      "eval_loss": 0.2517726719379425,
       "eval_macro avg": {
+        "f1-score": 0.8570122280122289,
+        "precision": 0.8542043580238825,
+        "recall": 0.8601292238790438,
+        "support": 36380.0
+      },
+      "eval_runtime": 5.062,
+      "eval_samples_per_second": 16.002,
+      "eval_steps_per_second": 2.173,
       "eval_weighted avg": {
+        "f1-score": 0.9122886837716081,
+        "precision": 0.9134709768686261,
+        "recall": 0.9113523914238593,
+        "support": 36380.0
       },
       "step": 324
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 573377029596000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-324/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2f0bdafd19c0347fe87a3f27a2ea54a847df1f75da4e3bbd7bf587c614e2949
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:db3de2ea286aed4cce53d86abf84d503faba79a292e98a5c89e444e2125b5ea5
 size 4920