Training in progress, epoch 3, checkpoint

Browse files

Files changed (5) hide show

checkpoint-243/model.safetensors +1 -1
checkpoint-243/optimizer.pt +1 -1
checkpoint-243/rng_state.pth +1 -1
checkpoint-243/trainer_state.json +127 -127
checkpoint-243/training_args.bin +1 -1

checkpoint-243/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71619f75212984822424498b5ac69981a254fa558d304cc020365c00147f41e3
 size 592330980

 version https://git-lfs.github.com/spec/v1
+oid sha256:25a2c42b72213f05d48313b6162ebb7ab66bbc47ae43fae7a5a2edb96eedeeac
 size 592330980

checkpoint-243/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e2d4f952aab4cc4283b73dd02db181f0a445932e628f5ff99d79d7885af15b6
 size 1014670074

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b40debbf7acf1fd82785e3664009a289b7053017312072e7518dbf209427584
 size 1014670074

checkpoint-243/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4510120abb9e19965e0fc90a9342c8b839c7b334c4b005e1a74bbda01d4f51cc
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:becd6836611c76f35df7d32580a0d0ecb16ccf6774d717a60f2504beb710244c
 size 14244

checkpoint-243/trainer_state.json CHANGED Viewed

@@ -11,189 +11,189 @@
     {
       "epoch": 1.0,
       "eval_B-Claim": {
-        "f1-score": 0.17153996101364524,
-        "precision": 0.25287356321839083,
-        "recall": 0.12979351032448377,
-        "support": 339.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.08383233532934131,
-        "precision": 1.0,
-        "recall": 0.04375,
-        "support": 160.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8469620831429876,
-        "precision": 0.7427884615384616,
-        "recall": 0.9851222104144527,
-        "support": 941.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.5420081967213116,
-        "precision": 0.6803858520900321,
-        "recall": 0.4504044274159217,
-        "support": 4698.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.8343351767251743,
-        "precision": 0.8141717503519474,
-        "recall": 0.8555226824457594,
-        "support": 2028.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9004323458767015,
-        "precision": 0.8590809093131264,
-        "recall": 0.9459659511472983,
-        "support": 14861.0
       },
       "eval_O": {
-        "f1-score": 0.9988389078242631,
-        "precision": 0.9991008541885209,
-        "recall": 0.9985770987793006,
-        "support": 13353.0
       },
-      "eval_accuracy": 0.8856789444749863,
-      "eval_loss": 0.28347474336624146,
       "eval_macro avg": {
-        "f1-score": 0.6254212866619178,
-        "precision": 0.76405734152864,
-        "recall": 0.629876554361031,
-        "support": 36380.0
-      },
-      "eval_runtime": 5.0448,
-      "eval_samples_per_second": 16.056,
-      "eval_steps_per_second": 2.18,
       "eval_weighted avg": {
-        "f1-score": 0.8748148382495958,
-        "precision": 0.8768575102351055,
-        "recall": 0.8856789444749863,
-        "support": 36380.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
-        "f1-score": 0.5137931034482759,
-        "precision": 0.6182572614107884,
-        "recall": 0.43952802359882004,
-        "support": 339.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.7622641509433963,
-        "precision": 0.9619047619047619,
-        "recall": 0.63125,
-        "support": 160.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8853910477127397,
-        "precision": 0.8241758241758241,
-        "recall": 0.9564293304994687,
-        "support": 941.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.5413588470388762,
-        "precision": 0.6279853891542568,
-        "recall": 0.47573435504469985,
-        "support": 4698.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.7949260042283298,
-        "precision": 0.856492027334852,
-        "recall": 0.7416173570019724,
-        "support": 2028.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9007064868336545,
-        "precision": 0.8614779777627618,
-        "recall": 0.9436780835744566,
-        "support": 14861.0
       },
       "eval_O": {
-        "f1-score": 0.9988389947942025,
-        "precision": 0.9990260713215463,
-        "recall": 0.9986519883172321,
-        "support": 13353.0
       },
-      "eval_accuracy": 0.8864211105002748,
-      "eval_loss": 0.2809496521949768,
       "eval_macro avg": {
-        "f1-score": 0.7710398049999251,
-        "precision": 0.8213313304378275,
-        "recall": 0.7409841625766643,
-        "support": 36380.0
-      },
-      "eval_runtime": 5.0579,
-      "eval_samples_per_second": 16.014,
-      "eval_steps_per_second": 2.175,
       "eval_weighted avg": {
-        "f1-score": 0.8798131143596267,
-        "precision": 0.8787439244541853,
-        "recall": 0.8864211105002748,
-        "support": 36380.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
-        "f1-score": 0.6401137980085349,
-        "precision": 0.6181318681318682,
-        "recall": 0.6637168141592921,
-        "support": 339.0
       },
       "eval_B-MajorClaim": {
-        "f1-score": 0.7918781725888324,
-        "precision": 0.6666666666666666,
-        "recall": 0.975,
-        "support": 160.0
       },
       "eval_B-Premise": {
-        "f1-score": 0.8866442199775534,
-        "precision": 0.93935790725327,
-        "recall": 0.8395324123273114,
-        "support": 941.0
       },
       "eval_I-Claim": {
-        "f1-score": 0.6254390633315594,
-        "precision": 0.6255056418990845,
-        "recall": 0.6253724989357173,
-        "support": 4698.0
       },
       "eval_I-MajorClaim": {
-        "f1-score": 0.76480605487228,
-        "precision": 0.6205096714768191,
-        "recall": 0.9965483234714004,
-        "support": 2028.0
       },
       "eval_I-Premise": {
-        "f1-score": 0.9049205625504156,
-        "precision": 0.9449897450922942,
-        "recall": 0.868111163447951,
-        "support": 14861.0
       },
       "eval_O": {
-        "f1-score": 0.9988758992805756,
-        "precision": 0.9995500562429697,
-        "recall": 0.9982026510896428,
-        "support": 13353.0
       },
-      "eval_accuracy": 0.8894997251236944,
-      "eval_loss": 0.318760484457016,
       "eval_macro avg": {
-        "f1-score": 0.8018111100871074,
-        "precision": 0.7735302223947104,
-        "recall": 0.852354837633045,
-        "support": 36380.0
-      },
-      "eval_runtime": 5.0862,
-      "eval_samples_per_second": 15.925,
-      "eval_steps_per_second": 2.163,
       "eval_weighted avg": {
-        "f1-score": 0.8920666591013163,
-        "precision": 0.9012548868310761,
-        "recall": 0.8894997251236944,
-        "support": 36380.0
       },
       "step": 243
     }
@@ -203,7 +203,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 430032772197000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 1.0,
       "eval_B-Claim": {
+        "f1-score": 0.37160751565762,
+        "precision": 0.42788461538461536,
+        "recall": 0.3284132841328413,
+        "support": 271.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.3578947368421052,
+        "precision": 0.6666666666666666,
+        "recall": 0.2446043165467626,
+        "support": 139.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8640915593705293,
+        "precision": 0.7895424836601307,
+        "recall": 0.9541864139020537,
+        "support": 633.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5003402749421533,
+        "precision": 0.5493126120741183,
+        "recall": 0.4593851537115721,
+        "support": 4001.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.7718093699515347,
+        "precision": 0.6502211636611093,
+        "recall": 0.9493293591654247,
+        "support": 2013.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.875016720916752,
+        "precision": 0.8846812731043188,
+        "recall": 0.865561044460127,
+        "support": 11336.0
       },
       "eval_O": {
+        "f1-score": 0.9992483530087988,
+        "precision": 0.9995577178239717,
+        "recall": 0.998939179632249,
+        "support": 11312.0
       },
+      "eval_accuracy": 0.8614038040733883,
+      "eval_loss": 0.31713685393333435,
       "eval_macro avg": {
+        "f1-score": 0.6771440758127848,
+        "precision": 0.7096952189107044,
+        "recall": 0.685774107364433,
+        "support": 29705.0
+      },
+      "eval_runtime": 4.8338,
+      "eval_samples_per_second": 16.55,
+      "eval_steps_per_second": 2.069,
       "eval_weighted avg": {
+        "f1-score": 0.8576207231627551,
+        "precision": 0.8601529227027923,
+        "recall": 0.8614038040733883,
+        "support": 29705.0
       },
       "step": 81
     },
     {
       "epoch": 2.0,
       "eval_B-Claim": {
+        "f1-score": 0.4708624708624709,
+        "precision": 0.6392405063291139,
+        "recall": 0.3726937269372694,
+        "support": 271.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.796875,
+        "precision": 0.8717948717948718,
+        "recall": 0.7338129496402878,
+        "support": 139.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8736616702355461,
+        "precision": 0.796875,
+        "recall": 0.966824644549763,
+        "support": 633.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5100589925881107,
+        "precision": 0.6459770114942529,
+        "recall": 0.4213946513371657,
+        "support": 4001.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8401387776888176,
+        "precision": 0.9077277970011534,
+        "recall": 0.7819175360158966,
+        "support": 2013.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.8912891699864469,
+        "precision": 0.8338584492430646,
+        "recall": 0.9572159491884262,
+        "support": 11336.0
       },
       "eval_O": {
+        "f1-score": 0.9996904982977407,
+        "precision": 1.0,
+        "recall": 0.9993811881188119,
+        "support": 11312.0
       },
+      "eval_accuracy": 0.8830499915839084,
+      "eval_loss": 0.2966194748878479,
       "eval_macro avg": {
+        "f1-score": 0.7689395113798762,
+        "precision": 0.8136390908374939,
+        "recall": 0.7476058065410885,
+        "support": 29705.0
+      },
+      "eval_runtime": 4.8625,
+      "eval_samples_per_second": 16.452,
+      "eval_steps_per_second": 2.057,
       "eval_weighted avg": {
+        "f1-score": 0.8731020208182413,
+        "precision": 0.874440834821272,
+        "recall": 0.8830499915839084,
+        "support": 29705.0
       },
       "step": 162
     },
     {
       "epoch": 3.0,
       "eval_B-Claim": {
+        "f1-score": 0.6085192697768763,
+        "precision": 0.6756756756756757,
+        "recall": 0.5535055350553506,
+        "support": 271.0
       },
       "eval_B-MajorClaim": {
+        "f1-score": 0.8571428571428571,
+        "precision": 0.851063829787234,
+        "recall": 0.8633093525179856,
+        "support": 139.0
       },
       "eval_B-Premise": {
+        "f1-score": 0.8834729626808834,
+        "precision": 0.8529411764705882,
+        "recall": 0.9162717219589257,
+        "support": 633.0
       },
       "eval_I-Claim": {
+        "f1-score": 0.5764474423833614,
+        "precision": 0.6584269662921348,
+        "recall": 0.5126218445388653,
+        "support": 4001.0
       },
       "eval_I-MajorClaim": {
+        "f1-score": 0.8581151832460733,
+        "precision": 0.9070282235749861,
+        "recall": 0.8142076502732241,
+        "support": 2013.0
       },
       "eval_I-Premise": {
+        "f1-score": 0.8959744247675935,
+        "precision": 0.8563158317922328,
+        "recall": 0.939484827099506,
+        "support": 11336.0
       },
       "eval_O": {
+        "f1-score": 0.9996020340481981,
+        "precision": 1.0,
+        "recall": 0.9992043847241867,
+        "support": 11312.0
       },
+      "eval_accuracy": 0.8918700555462044,
+      "eval_loss": 0.2552729547023773,
       "eval_macro avg": {
+        "f1-score": 0.811324882006549,
+        "precision": 0.8287788147989789,
+        "recall": 0.7998007594525776,
+        "support": 29705.0
+      },
+      "eval_runtime": 4.8422,
+      "eval_samples_per_second": 16.522,
+      "eval_steps_per_second": 2.065,
       "eval_weighted avg": {
+        "f1-score": 0.8867633844066056,
+        "precision": 0.886070631898416,
+        "recall": 0.8918700555462044,
+        "support": 29705.0
       },
       "step": 243
     }
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 431372438154000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

checkpoint-243/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db3de2ea286aed4cce53d86abf84d503faba79a292e98a5c89e444e2125b5ea5
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3aa7d1dcb1ecb96052506e9849f1d3fa19e688784f8ea37f784dfaca9546785
 size 4920