End of training

Browse files

Files changed (5) hide show

README.md +3 -1
all_results.json +19 -0
eval_results.json +14 -0
train_results.json +8 -0
trainer_state.json +1217 -0

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ library_name: transformers
 license: other
 base_model: nvidia/mit-b0
 tags:
 - generated_from_trainer
 model-index:
 - name: segformer-finetuned-tt-225-2k
@@ -14,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 # segformer-finetuned-tt-225-2k
-This model is a fine-tuned version of [nvidia/mit-b0](https://huggingface.co/nvidia/mit-b0) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.1299
 - Mean Iou: 0.4851

 license: other
 base_model: nvidia/mit-b0
 tags:
+- image-segmentation
+- vision
 - generated_from_trainer
 model-index:
 - name: segformer-finetuned-tt-225-2k
 # segformer-finetuned-tt-225-2k
+This model is a fine-tuned version of [nvidia/mit-b0](https://huggingface.co/nvidia/mit-b0) on the Saumya-Mundra/text255 dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.1299
 - Mean Iou: 0.4851

all_results.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "epoch": 68.96551724137932,
+    "eval_accuracy_no_text": 0.9701784379830324,
+    "eval_accuracy_text": NaN,
+    "eval_iou_no_text": 0.9701784379830324,
+    "eval_iou_text": 0.0,
+    "eval_loss": 0.12989187240600586,
+    "eval_mean_accuracy": 0.9701784379830324,
+    "eval_mean_iou": 0.4850892189915162,
+    "eval_overall_accuracy": 0.9701784379830324,
+    "eval_runtime": 2.4511,
+    "eval_samples_per_second": 30.599,
+    "eval_steps_per_second": 4.08,
+    "total_flos": 2.7210398151632486e+17,
+    "train_loss": 0.11668173718452454,
+    "train_runtime": 724.9682,
+    "train_samples_per_second": 22.07,
+    "train_steps_per_second": 2.759
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 68.96551724137932,
+    "eval_accuracy_no_text": 0.9701784379830324,
+    "eval_accuracy_text": NaN,
+    "eval_iou_no_text": 0.9701784379830324,
+    "eval_iou_text": 0.0,
+    "eval_loss": 0.12989187240600586,
+    "eval_mean_accuracy": 0.9701784379830324,
+    "eval_mean_iou": 0.4850892189915162,
+    "eval_overall_accuracy": 0.9701784379830324,
+    "eval_runtime": 2.4511,
+    "eval_samples_per_second": 30.599,
+    "eval_steps_per_second": 4.08
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 68.96551724137932,
+    "total_flos": 2.7210398151632486e+17,
+    "train_loss": 0.11668173718452454,
+    "train_runtime": 724.9682,
+    "train_samples_per_second": 22.07,
+    "train_steps_per_second": 2.759
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1217 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 68.96551724137932,
+  "eval_steps": 500,
+  "global_step": 2000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy_no_text": 0.9411412367275587,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9411412367275587,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.26036718487739563,
+      "eval_mean_accuracy": 0.9411412367275587,
+      "eval_mean_iou": 0.47057061836377934,
+      "eval_overall_accuracy": 0.9411412367275587,
+      "eval_runtime": 2.53,
+      "eval_samples_per_second": 29.644,
+      "eval_steps_per_second": 3.953,
+      "step": 29
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy_no_text": 0.9556761981853922,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9556761981853922,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.20939157903194427,
+      "eval_mean_accuracy": 0.9556761981853922,
+      "eval_mean_iou": 0.4778380990926961,
+      "eval_overall_accuracy": 0.9556761981853922,
+      "eval_runtime": 2.5445,
+      "eval_samples_per_second": 29.475,
+      "eval_steps_per_second": 3.93,
+      "step": 58
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy_no_text": 0.9646688438230138,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9646688438230138,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.18179728090763092,
+      "eval_mean_accuracy": 0.9646688438230138,
+      "eval_mean_iou": 0.4823344219115069,
+      "eval_overall_accuracy": 0.9646688438230138,
+      "eval_runtime": 2.5227,
+      "eval_samples_per_second": 29.73,
+      "eval_steps_per_second": 3.964,
+      "step": 87
+    },
+    {
+      "epoch": 3.4482758620689653,
+      "grad_norm": 69.57986450195312,
+      "learning_rate": 5.7005e-05,
+      "loss": 0.323,
+      "step": 100
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy_no_text": 0.9392420264366191,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9392420264366191,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.20981624722480774,
+      "eval_mean_accuracy": 0.9392420264366191,
+      "eval_mean_iou": 0.46962101321830957,
+      "eval_overall_accuracy": 0.9392420264366191,
+      "eval_runtime": 2.5287,
+      "eval_samples_per_second": 29.66,
+      "eval_steps_per_second": 3.955,
+      "step": 116
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy_no_text": 0.9698847328744703,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9698847328744703,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.17170381546020508,
+      "eval_mean_accuracy": 0.9698847328744703,
+      "eval_mean_iou": 0.48494236643723515,
+      "eval_overall_accuracy": 0.9698847328744703,
+      "eval_runtime": 2.4809,
+      "eval_samples_per_second": 30.231,
+      "eval_steps_per_second": 4.031,
+      "step": 145
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy_no_text": 0.9680704296500666,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9680704296500666,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.14835301041603088,
+      "eval_mean_accuracy": 0.9680704296500666,
+      "eval_mean_iou": 0.4840352148250333,
+      "eval_overall_accuracy": 0.9680704296500666,
+      "eval_runtime": 2.518,
+      "eval_samples_per_second": 29.786,
+      "eval_steps_per_second": 3.971,
+      "step": 174
+    },
+    {
+      "epoch": 6.896551724137931,
+      "grad_norm": 2.1472854614257812,
+      "learning_rate": 5.401e-05,
+      "loss": 0.2027,
+      "step": 200
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy_no_text": 0.9630674570564881,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9630674570564881,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.16156023740768433,
+      "eval_mean_accuracy": 0.9630674570564881,
+      "eval_mean_iou": 0.48153372852824405,
+      "eval_overall_accuracy": 0.9630674570564881,
+      "eval_runtime": 2.5744,
+      "eval_samples_per_second": 29.133,
+      "eval_steps_per_second": 3.884,
+      "step": 203
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy_no_text": 0.9727854516339448,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9727854516339448,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.15030205249786377,
+      "eval_mean_accuracy": 0.9727854516339448,
+      "eval_mean_iou": 0.4863927258169724,
+      "eval_overall_accuracy": 0.9727854516339448,
+      "eval_runtime": 2.6278,
+      "eval_samples_per_second": 28.541,
+      "eval_steps_per_second": 3.806,
+      "step": 232
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy_no_text": 0.9566264239140725,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9566264239140725,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.16279229521751404,
+      "eval_mean_accuracy": 0.9566264239140725,
+      "eval_mean_iou": 0.47831321195703624,
+      "eval_overall_accuracy": 0.9566264239140725,
+      "eval_runtime": 2.4976,
+      "eval_samples_per_second": 30.029,
+      "eval_steps_per_second": 4.004,
+      "step": 261
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy_no_text": 0.9670189360247539,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9670189360247539,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.142441064119339,
+      "eval_mean_accuracy": 0.9670189360247539,
+      "eval_mean_iou": 0.48350946801237693,
+      "eval_overall_accuracy": 0.9670189360247539,
+      "eval_runtime": 2.5057,
+      "eval_samples_per_second": 29.931,
+      "eval_steps_per_second": 3.991,
+      "step": 290
+    },
+    {
+      "epoch": 10.344827586206897,
+      "grad_norm": 0.8168253302574158,
+      "learning_rate": 5.1015e-05,
+      "loss": 0.1693,
+      "step": 300
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy_no_text": 0.9806479024118233,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9806479024118233,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12359502166509628,
+      "eval_mean_accuracy": 0.9806479024118233,
+      "eval_mean_iou": 0.49032395120591166,
+      "eval_overall_accuracy": 0.9806479024118233,
+      "eval_runtime": 2.5703,
+      "eval_samples_per_second": 29.18,
+      "eval_steps_per_second": 3.891,
+      "step": 319
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy_no_text": 0.9632355222732392,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9632355222732392,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13876928389072418,
+      "eval_mean_accuracy": 0.9632355222732392,
+      "eval_mean_iou": 0.4816177611366196,
+      "eval_overall_accuracy": 0.9632355222732392,
+      "eval_runtime": 2.4816,
+      "eval_samples_per_second": 30.223,
+      "eval_steps_per_second": 4.03,
+      "step": 348
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy_no_text": 0.9576819795385817,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9576819795385817,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1554112434387207,
+      "eval_mean_accuracy": 0.9576819795385817,
+      "eval_mean_iou": 0.47884098976929085,
+      "eval_overall_accuracy": 0.9576819795385817,
+      "eval_runtime": 2.4981,
+      "eval_samples_per_second": 30.023,
+      "eval_steps_per_second": 4.003,
+      "step": 377
+    },
+    {
+      "epoch": 13.793103448275861,
+      "grad_norm": 3.8616011142730713,
+      "learning_rate": 4.8020000000000004e-05,
+      "loss": 0.1502,
+      "step": 400
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy_no_text": 0.9521418075512791,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9521418075512791,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.15367722511291504,
+      "eval_mean_accuracy": 0.9521418075512791,
+      "eval_mean_iou": 0.47607090377563954,
+      "eval_overall_accuracy": 0.9521418075512791,
+      "eval_runtime": 2.5218,
+      "eval_samples_per_second": 29.741,
+      "eval_steps_per_second": 3.965,
+      "step": 406
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy_no_text": 0.9562213523275425,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9562213523275425,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.14778192341327667,
+      "eval_mean_accuracy": 0.9562213523275425,
+      "eval_mean_iou": 0.47811067616377123,
+      "eval_overall_accuracy": 0.9562213523275425,
+      "eval_runtime": 2.4931,
+      "eval_samples_per_second": 30.083,
+      "eval_steps_per_second": 4.011,
+      "step": 435
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy_no_text": 0.9650662991610505,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9650662991610505,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1367165446281433,
+      "eval_mean_accuracy": 0.9650662991610505,
+      "eval_mean_iou": 0.48253314958052523,
+      "eval_overall_accuracy": 0.9650662991610505,
+      "eval_runtime": 2.5189,
+      "eval_samples_per_second": 29.774,
+      "eval_steps_per_second": 3.97,
+      "step": 464
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy_no_text": 0.9702622167164582,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9702622167164582,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13298067450523376,
+      "eval_mean_accuracy": 0.9702622167164582,
+      "eval_mean_iou": 0.4851311083582291,
+      "eval_overall_accuracy": 0.9702622167164582,
+      "eval_runtime": 2.4829,
+      "eval_samples_per_second": 30.207,
+      "eval_steps_per_second": 4.028,
+      "step": 493
+    },
+    {
+      "epoch": 17.24137931034483,
+      "grad_norm": 0.5257724523544312,
+      "learning_rate": 4.5025000000000003e-05,
+      "loss": 0.127,
+      "step": 500
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy_no_text": 0.9695612961884569,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9695612961884569,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13220080733299255,
+      "eval_mean_accuracy": 0.9695612961884569,
+      "eval_mean_iou": 0.48478064809422844,
+      "eval_overall_accuracy": 0.9695612961884569,
+      "eval_runtime": 2.4852,
+      "eval_samples_per_second": 30.179,
+      "eval_steps_per_second": 4.024,
+      "step": 522
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy_no_text": 0.9684219618305219,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9684219618305219,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13408276438713074,
+      "eval_mean_accuracy": 0.9684219618305219,
+      "eval_mean_iou": 0.48421098091526094,
+      "eval_overall_accuracy": 0.9684219618305219,
+      "eval_runtime": 2.5013,
+      "eval_samples_per_second": 29.984,
+      "eval_steps_per_second": 3.998,
+      "step": 551
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy_no_text": 0.9764442974101032,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9764442974101032,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12438876926898956,
+      "eval_mean_accuracy": 0.9764442974101032,
+      "eval_mean_iou": 0.4882221487050516,
+      "eval_overall_accuracy": 0.9764442974101032,
+      "eval_runtime": 2.4814,
+      "eval_samples_per_second": 30.225,
+      "eval_steps_per_second": 4.03,
+      "step": 580
+    },
+    {
+      "epoch": 20.689655172413794,
+      "grad_norm": 0.9491066336631775,
+      "learning_rate": 4.203e-05,
+      "loss": 0.1173,
+      "step": 600
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy_no_text": 0.9792908561802923,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9792908561802923,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1200159564614296,
+      "eval_mean_accuracy": 0.9792908561802923,
+      "eval_mean_iou": 0.48964542809014616,
+      "eval_overall_accuracy": 0.9792908561802923,
+      "eval_runtime": 2.4555,
+      "eval_samples_per_second": 30.544,
+      "eval_steps_per_second": 4.072,
+      "step": 609
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy_no_text": 0.9652650550383967,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9652650550383967,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13735905289649963,
+      "eval_mean_accuracy": 0.9652650550383967,
+      "eval_mean_iou": 0.48263252751919833,
+      "eval_overall_accuracy": 0.9652650550383967,
+      "eval_runtime": 2.4618,
+      "eval_samples_per_second": 30.465,
+      "eval_steps_per_second": 4.062,
+      "step": 638
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy_no_text": 0.9768179449195166,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9768179449195166,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1247735321521759,
+      "eval_mean_accuracy": 0.9768179449195166,
+      "eval_mean_iou": 0.4884089724597583,
+      "eval_overall_accuracy": 0.9768179449195166,
+      "eval_runtime": 2.5434,
+      "eval_samples_per_second": 29.489,
+      "eval_steps_per_second": 3.932,
+      "step": 667
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy_no_text": 0.9713726093301188,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9713726093301188,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12621533870697021,
+      "eval_mean_accuracy": 0.9713726093301188,
+      "eval_mean_iou": 0.4856863046650594,
+      "eval_overall_accuracy": 0.9713726093301188,
+      "eval_runtime": 2.5006,
+      "eval_samples_per_second": 29.993,
+      "eval_steps_per_second": 3.999,
+      "step": 696
+    },
+    {
+      "epoch": 24.137931034482758,
+      "grad_norm": 1.288313627243042,
+      "learning_rate": 3.9035e-05,
+      "loss": 0.1193,
+      "step": 700
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy_no_text": 0.9719735595445641,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9719735595445641,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12352190911769867,
+      "eval_mean_accuracy": 0.9719735595445641,
+      "eval_mean_iou": 0.48598677977228205,
+      "eval_overall_accuracy": 0.9719735595445641,
+      "eval_runtime": 2.4888,
+      "eval_samples_per_second": 30.135,
+      "eval_steps_per_second": 4.018,
+      "step": 725
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy_no_text": 0.9676620294808619,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9676620294808619,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1323447823524475,
+      "eval_mean_accuracy": 0.9676620294808619,
+      "eval_mean_iou": 0.48383101474043094,
+      "eval_overall_accuracy": 0.9676620294808619,
+      "eval_runtime": 2.5267,
+      "eval_samples_per_second": 29.683,
+      "eval_steps_per_second": 3.958,
+      "step": 754
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy_no_text": 0.970691829548133,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.970691829548133,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12354418635368347,
+      "eval_mean_accuracy": 0.970691829548133,
+      "eval_mean_iou": 0.4853459147740665,
+      "eval_overall_accuracy": 0.970691829548133,
+      "eval_runtime": 2.5317,
+      "eval_samples_per_second": 29.625,
+      "eval_steps_per_second": 3.95,
+      "step": 783
+    },
+    {
+      "epoch": 27.586206896551722,
+      "grad_norm": 0.8687916398048401,
+      "learning_rate": 3.604e-05,
+      "loss": 0.0912,
+      "step": 800
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy_no_text": 0.9631846908666286,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9631846908666286,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13487361371517181,
+      "eval_mean_accuracy": 0.9631846908666286,
+      "eval_mean_iou": 0.4815923454333143,
+      "eval_overall_accuracy": 0.9631846908666286,
+      "eval_runtime": 2.5216,
+      "eval_samples_per_second": 29.743,
+      "eval_steps_per_second": 3.966,
+      "step": 812
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy_no_text": 0.9631912351986673,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9631912351986673,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.140753835439682,
+      "eval_mean_accuracy": 0.9631912351986673,
+      "eval_mean_iou": 0.48159561759933367,
+      "eval_overall_accuracy": 0.9631912351986673,
+      "eval_runtime": 2.4836,
+      "eval_samples_per_second": 30.198,
+      "eval_steps_per_second": 4.026,
+      "step": 841
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy_no_text": 0.9753996302001064,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9753996302001064,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1205972284078598,
+      "eval_mean_accuracy": 0.9753996302001064,
+      "eval_mean_iou": 0.4876998151000532,
+      "eval_overall_accuracy": 0.9753996302001064,
+      "eval_runtime": 2.4858,
+      "eval_samples_per_second": 30.171,
+      "eval_steps_per_second": 4.023,
+      "step": 870
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy_no_text": 0.9646436819946582,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9646436819946582,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13470463454723358,
+      "eval_mean_accuracy": 0.9646436819946582,
+      "eval_mean_iou": 0.4823218409973291,
+      "eval_overall_accuracy": 0.9646436819946582,
+      "eval_runtime": 2.4993,
+      "eval_samples_per_second": 30.009,
+      "eval_steps_per_second": 4.001,
+      "step": 899
+    },
+    {
+      "epoch": 31.03448275862069,
+      "grad_norm": 1.7799224853515625,
+      "learning_rate": 3.3045000000000006e-05,
+      "loss": 0.1005,
+      "step": 900
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy_no_text": 0.9757926850390138,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9757926850390138,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.11876140534877777,
+      "eval_mean_accuracy": 0.9757926850390138,
+      "eval_mean_iou": 0.4878963425195069,
+      "eval_overall_accuracy": 0.9757926850390138,
+      "eval_runtime": 2.4793,
+      "eval_samples_per_second": 30.25,
+      "eval_steps_per_second": 4.033,
+      "step": 928
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy_no_text": 0.9781089272474506,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9781089272474506,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12336363643407822,
+      "eval_mean_accuracy": 0.9781089272474506,
+      "eval_mean_iou": 0.4890544636237253,
+      "eval_overall_accuracy": 0.9781089272474506,
+      "eval_runtime": 2.4798,
+      "eval_samples_per_second": 30.245,
+      "eval_steps_per_second": 4.033,
+      "step": 957
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy_no_text": 0.9848704069931378,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9848704069931378,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12059501558542252,
+      "eval_mean_accuracy": 0.9848704069931378,
+      "eval_mean_iou": 0.4924352034965689,
+      "eval_overall_accuracy": 0.9848704069931378,
+      "eval_runtime": 2.5063,
+      "eval_samples_per_second": 29.925,
+      "eval_steps_per_second": 3.99,
+      "step": 986
+    },
+    {
+      "epoch": 34.48275862068966,
+      "grad_norm": 1.1413416862487793,
+      "learning_rate": 3.0050000000000002e-05,
+      "loss": 0.0933,
+      "step": 1000
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy_no_text": 0.9789616085787618,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9789616085787618,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12342917174100876,
+      "eval_mean_accuracy": 0.9789616085787618,
+      "eval_mean_iou": 0.4894808042893809,
+      "eval_overall_accuracy": 0.9789616085787618,
+      "eval_runtime": 2.4727,
+      "eval_samples_per_second": 30.332,
+      "eval_steps_per_second": 4.044,
+      "step": 1015
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy_no_text": 0.9753304069638011,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9753304069638011,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1192336305975914,
+      "eval_mean_accuracy": 0.9753304069638011,
+      "eval_mean_iou": 0.48766520348190057,
+      "eval_overall_accuracy": 0.9753304069638011,
+      "eval_runtime": 2.4878,
+      "eval_samples_per_second": 30.147,
+      "eval_steps_per_second": 4.02,
+      "step": 1044
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy_no_text": 0.9614615005408664,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9614615005408664,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13877929747104645,
+      "eval_mean_accuracy": 0.9614615005408664,
+      "eval_mean_iou": 0.4807307502704332,
+      "eval_overall_accuracy": 0.9614615005408664,
+      "eval_runtime": 2.4791,
+      "eval_samples_per_second": 30.253,
+      "eval_steps_per_second": 4.034,
+      "step": 1073
+    },
+    {
+      "epoch": 37.93103448275862,
+      "grad_norm": 0.8322708606719971,
+      "learning_rate": 2.7054999999999998e-05,
+      "loss": 0.0937,
+      "step": 1100
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy_no_text": 0.9719491311327302,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9719491311327302,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12549874186515808,
+      "eval_mean_accuracy": 0.9719491311327302,
+      "eval_mean_iou": 0.4859745655663651,
+      "eval_overall_accuracy": 0.9719491311327302,
+      "eval_runtime": 2.5079,
+      "eval_samples_per_second": 29.905,
+      "eval_steps_per_second": 3.987,
+      "step": 1102
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy_no_text": 0.9754536209394253,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9754536209394253,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.11986999213695526,
+      "eval_mean_accuracy": 0.9754536209394253,
+      "eval_mean_iou": 0.48772681046971267,
+      "eval_overall_accuracy": 0.9754536209394253,
+      "eval_runtime": 2.5348,
+      "eval_samples_per_second": 29.588,
+      "eval_steps_per_second": 3.945,
+      "step": 1131
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy_no_text": 0.9798514684860512,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9798514684860512,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.11944077908992767,
+      "eval_mean_accuracy": 0.9798514684860512,
+      "eval_mean_iou": 0.4899257342430256,
+      "eval_overall_accuracy": 0.9798514684860512,
+      "eval_runtime": 2.5215,
+      "eval_samples_per_second": 29.744,
+      "eval_steps_per_second": 3.966,
+      "step": 1160
+    },
+    {
+      "epoch": 41.0,
+      "eval_accuracy_no_text": 0.9687282478532616,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9687282478532616,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12739954888820648,
+      "eval_mean_accuracy": 0.9687282478532616,
+      "eval_mean_iou": 0.4843641239266308,
+      "eval_overall_accuracy": 0.9687282478532616,
+      "eval_runtime": 2.483,
+      "eval_samples_per_second": 30.206,
+      "eval_steps_per_second": 4.027,
+      "step": 1189
+    },
+    {
+      "epoch": 41.37931034482759,
+      "grad_norm": 0.581297755241394,
+      "learning_rate": 2.406e-05,
+      "loss": 0.0923,
+      "step": 1200
+    },
+    {
+      "epoch": 42.0,
+      "eval_accuracy_no_text": 0.9703110735401259,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9703110735401259,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13015305995941162,
+      "eval_mean_accuracy": 0.9703110735401259,
+      "eval_mean_iou": 0.48515553677006296,
+      "eval_overall_accuracy": 0.9703110735401259,
+      "eval_runtime": 2.4521,
+      "eval_samples_per_second": 30.586,
+      "eval_steps_per_second": 4.078,
+      "step": 1218
+    },
+    {
+      "epoch": 43.0,
+      "eval_accuracy_no_text": 0.9708830820102969,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9708830820102969,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1296657919883728,
+      "eval_mean_accuracy": 0.9708830820102969,
+      "eval_mean_iou": 0.48544154100514847,
+      "eval_overall_accuracy": 0.9708830820102969,
+      "eval_runtime": 2.5553,
+      "eval_samples_per_second": 29.351,
+      "eval_steps_per_second": 3.913,
+      "step": 1247
+    },
+    {
+      "epoch": 44.0,
+      "eval_accuracy_no_text": 0.9700965774158937,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9700965774158937,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12993517518043518,
+      "eval_mean_accuracy": 0.9700965774158937,
+      "eval_mean_iou": 0.48504828870794686,
+      "eval_overall_accuracy": 0.9700965774158937,
+      "eval_runtime": 2.572,
+      "eval_samples_per_second": 29.16,
+      "eval_steps_per_second": 3.888,
+      "step": 1276
+    },
+    {
+      "epoch": 44.827586206896555,
+      "grad_norm": 0.5657644867897034,
+      "learning_rate": 2.1065e-05,
+      "loss": 0.0812,
+      "step": 1300
+    },
+    {
+      "epoch": 45.0,
+      "eval_accuracy_no_text": 0.9733241742773675,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9733241742773675,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12587976455688477,
+      "eval_mean_accuracy": 0.9733241742773675,
+      "eval_mean_iou": 0.48666208713868375,
+      "eval_overall_accuracy": 0.9733241742773675,
+      "eval_runtime": 2.476,
+      "eval_samples_per_second": 30.291,
+      "eval_steps_per_second": 4.039,
+      "step": 1305
+    },
+    {
+      "epoch": 46.0,
+      "eval_accuracy_no_text": 0.9766478487031672,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9766478487031672,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12515687942504883,
+      "eval_mean_accuracy": 0.9766478487031672,
+      "eval_mean_iou": 0.4883239243515836,
+      "eval_overall_accuracy": 0.9766478487031672,
+      "eval_runtime": 2.468,
+      "eval_samples_per_second": 30.389,
+      "eval_steps_per_second": 4.052,
+      "step": 1334
+    },
+    {
+      "epoch": 47.0,
+      "eval_accuracy_no_text": 0.9761687020479585,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9761687020479585,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12227589637041092,
+      "eval_mean_accuracy": 0.9761687020479585,
+      "eval_mean_iou": 0.48808435102397923,
+      "eval_overall_accuracy": 0.9761687020479585,
+      "eval_runtime": 2.4339,
+      "eval_samples_per_second": 30.815,
+      "eval_steps_per_second": 4.109,
+      "step": 1363
+    },
+    {
+      "epoch": 48.0,
+      "eval_accuracy_no_text": 0.9757235746360194,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9757235746360194,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12267401069402695,
+      "eval_mean_accuracy": 0.9757235746360194,
+      "eval_mean_iou": 0.4878617873180097,
+      "eval_overall_accuracy": 0.9757235746360194,
+      "eval_runtime": 2.4543,
+      "eval_samples_per_second": 30.559,
+      "eval_steps_per_second": 4.075,
+      "step": 1392
+    },
+    {
+      "epoch": 48.275862068965516,
+      "grad_norm": 1.296958565711975,
+      "learning_rate": 1.807e-05,
+      "loss": 0.0901,
+      "step": 1400
+    },
+    {
+      "epoch": 49.0,
+      "eval_accuracy_no_text": 0.9759114985155085,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9759114985155085,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12235772609710693,
+      "eval_mean_accuracy": 0.9759114985155085,
+      "eval_mean_iou": 0.48795574925775426,
+      "eval_overall_accuracy": 0.9759114985155085,
+      "eval_runtime": 2.4545,
+      "eval_samples_per_second": 30.556,
+      "eval_steps_per_second": 4.074,
+      "step": 1421
+    },
+    {
+      "epoch": 50.0,
+      "eval_accuracy_no_text": 0.9636262076126153,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9636262076126153,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13496458530426025,
+      "eval_mean_accuracy": 0.9636262076126153,
+      "eval_mean_iou": 0.48181310380630765,
+      "eval_overall_accuracy": 0.9636262076126153,
+      "eval_runtime": 2.4536,
+      "eval_samples_per_second": 30.567,
+      "eval_steps_per_second": 4.076,
+      "step": 1450
+    },
+    {
+      "epoch": 51.0,
+      "eval_accuracy_no_text": 0.9718740969809078,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9718740969809078,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12845410406589508,
+      "eval_mean_accuracy": 0.9718740969809078,
+      "eval_mean_iou": 0.4859370484904539,
+      "eval_overall_accuracy": 0.9718740969809078,
+      "eval_runtime": 2.4972,
+      "eval_samples_per_second": 30.034,
+      "eval_steps_per_second": 4.005,
+      "step": 1479
+    },
+    {
+      "epoch": 51.724137931034484,
+      "grad_norm": 1.6991603374481201,
+      "learning_rate": 1.5075000000000002e-05,
+      "loss": 0.083,
+      "step": 1500
+    },
+    {
+      "epoch": 52.0,
+      "eval_accuracy_no_text": 0.9695387295262546,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9695387295262546,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12856803834438324,
+      "eval_mean_accuracy": 0.9695387295262546,
+      "eval_mean_iou": 0.4847693647631273,
+      "eval_overall_accuracy": 0.9695387295262546,
+      "eval_runtime": 2.5249,
+      "eval_samples_per_second": 29.704,
+      "eval_steps_per_second": 3.961,
+      "step": 1508
+    },
+    {
+      "epoch": 53.0,
+      "eval_accuracy_no_text": 0.9700392580939001,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9700392580939001,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12850378453731537,
+      "eval_mean_accuracy": 0.9700392580939001,
+      "eval_mean_iou": 0.48501962904695006,
+      "eval_overall_accuracy": 0.9700392580939001,
+      "eval_runtime": 2.4685,
+      "eval_samples_per_second": 30.383,
+      "eval_steps_per_second": 4.051,
+      "step": 1537
+    },
+    {
+      "epoch": 54.0,
+      "eval_accuracy_no_text": 0.9775246199463794,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9775246199463794,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12516801059246063,
+      "eval_mean_accuracy": 0.9775246199463794,
+      "eval_mean_iou": 0.4887623099731897,
+      "eval_overall_accuracy": 0.9775246199463794,
+      "eval_runtime": 2.4581,
+      "eval_samples_per_second": 30.511,
+      "eval_steps_per_second": 4.068,
+      "step": 1566
+    },
+    {
+      "epoch": 55.0,
+      "eval_accuracy_no_text": 0.9734067118443722,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9734067118443722,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.1259094923734665,
+      "eval_mean_accuracy": 0.9734067118443722,
+      "eval_mean_iou": 0.4867033559221861,
+      "eval_overall_accuracy": 0.9734067118443722,
+      "eval_runtime": 2.4476,
+      "eval_samples_per_second": 30.642,
+      "eval_steps_per_second": 4.086,
+      "step": 1595
+    },
+    {
+      "epoch": 55.172413793103445,
+      "grad_norm": 0.6328563690185547,
+      "learning_rate": 1.2079999999999998e-05,
+      "loss": 0.0822,
+      "step": 1600
+    },
+    {
+      "epoch": 56.0,
+      "eval_accuracy_no_text": 0.9642389489080613,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9642389489080613,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13731960952281952,
+      "eval_mean_accuracy": 0.9642389489080613,
+      "eval_mean_iou": 0.48211947445403064,
+      "eval_overall_accuracy": 0.9642389489080613,
+      "eval_runtime": 2.4564,
+      "eval_samples_per_second": 30.532,
+      "eval_steps_per_second": 4.071,
+      "step": 1624
+    },
+    {
+      "epoch": 57.0,
+      "eval_accuracy_no_text": 0.9719260003039729,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9719260003039729,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12484534084796906,
+      "eval_mean_accuracy": 0.9719260003039729,
+      "eval_mean_iou": 0.48596300015198646,
+      "eval_overall_accuracy": 0.9719260003039729,
+      "eval_runtime": 2.4497,
+      "eval_samples_per_second": 30.616,
+      "eval_steps_per_second": 4.082,
+      "step": 1653
+    },
+    {
+      "epoch": 58.0,
+      "eval_accuracy_no_text": 0.9761464174690337,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9761464174690337,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12278713285923004,
+      "eval_mean_accuracy": 0.9761464174690337,
+      "eval_mean_iou": 0.4880732087345169,
+      "eval_overall_accuracy": 0.9761464174690337,
+      "eval_runtime": 2.4362,
+      "eval_samples_per_second": 30.786,
+      "eval_steps_per_second": 4.105,
+      "step": 1682
+    },
+    {
+      "epoch": 58.62068965517241,
+      "grad_norm": 1.0782545804977417,
+      "learning_rate": 9.085000000000002e-06,
+      "loss": 0.0777,
+      "step": 1700
+    },
+    {
+      "epoch": 59.0,
+      "eval_accuracy_no_text": 0.967698982390218,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.967698982390218,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13151277601718903,
+      "eval_mean_accuracy": 0.967698982390218,
+      "eval_mean_iou": 0.483849491195109,
+      "eval_overall_accuracy": 0.967698982390218,
+      "eval_runtime": 2.4544,
+      "eval_samples_per_second": 30.557,
+      "eval_steps_per_second": 4.074,
+      "step": 1711
+    },
+    {
+      "epoch": 60.0,
+      "eval_accuracy_no_text": 0.9766246614577545,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9766246614577545,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12540759146213531,
+      "eval_mean_accuracy": 0.9766246614577545,
+      "eval_mean_iou": 0.48831233072887725,
+      "eval_overall_accuracy": 0.9766246614577545,
+      "eval_runtime": 2.449,
+      "eval_samples_per_second": 30.624,
+      "eval_steps_per_second": 4.083,
+      "step": 1740
+    },
+    {
+      "epoch": 61.0,
+      "eval_accuracy_no_text": 0.9682487062814643,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9682487062814643,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13411304354667664,
+      "eval_mean_accuracy": 0.9682487062814643,
+      "eval_mean_iou": 0.48412435314073216,
+      "eval_overall_accuracy": 0.9682487062814643,
+      "eval_runtime": 2.4399,
+      "eval_samples_per_second": 30.739,
+      "eval_steps_per_second": 4.099,
+      "step": 1769
+    },
+    {
+      "epoch": 62.0,
+      "eval_accuracy_no_text": 0.9726401787460179,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9726401787460179,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12687736749649048,
+      "eval_mean_accuracy": 0.9726401787460179,
+      "eval_mean_iou": 0.48632008937300897,
+      "eval_overall_accuracy": 0.9726401787460179,
+      "eval_runtime": 2.4427,
+      "eval_samples_per_second": 30.703,
+      "eval_steps_per_second": 4.094,
+      "step": 1798
+    },
+    {
+      "epoch": 62.06896551724138,
+      "grad_norm": 0.44511547684669495,
+      "learning_rate": 6.0899999999999984e-06,
+      "loss": 0.079,
+      "step": 1800
+    },
+    {
+      "epoch": 63.0,
+      "eval_accuracy_no_text": 0.9755465955876985,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9755465955876985,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12655200064182281,
+      "eval_mean_accuracy": 0.9755465955876985,
+      "eval_mean_iou": 0.48777329779384926,
+      "eval_overall_accuracy": 0.9755465955876985,
+      "eval_runtime": 2.433,
+      "eval_samples_per_second": 30.826,
+      "eval_steps_per_second": 4.11,
+      "step": 1827
+    },
+    {
+      "epoch": 64.0,
+      "eval_accuracy_no_text": 0.9705849764026055,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9705849764026055,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13036541640758514,
+      "eval_mean_accuracy": 0.9705849764026055,
+      "eval_mean_iou": 0.4852924882013028,
+      "eval_overall_accuracy": 0.9705849764026055,
+      "eval_runtime": 2.4456,
+      "eval_samples_per_second": 30.668,
+      "eval_steps_per_second": 4.089,
+      "step": 1856
+    },
+    {
+      "epoch": 65.0,
+      "eval_accuracy_no_text": 0.974686523674516,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.974686523674516,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12534736096858978,
+      "eval_mean_accuracy": 0.974686523674516,
+      "eval_mean_iou": 0.487343261837258,
+      "eval_overall_accuracy": 0.974686523674516,
+      "eval_runtime": 2.4366,
+      "eval_samples_per_second": 30.78,
+      "eval_steps_per_second": 4.104,
+      "step": 1885
+    },
+    {
+      "epoch": 65.51724137931035,
+      "grad_norm": 0.8290705680847168,
+      "learning_rate": 3.0950000000000026e-06,
+      "loss": 0.0781,
+      "step": 1900
+    },
+    {
+      "epoch": 66.0,
+      "eval_accuracy_no_text": 0.9731443179796158,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9731443179796158,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12833286821842194,
+      "eval_mean_accuracy": 0.9731443179796158,
+      "eval_mean_iou": 0.4865721589898079,
+      "eval_overall_accuracy": 0.9731443179796158,
+      "eval_runtime": 2.4332,
+      "eval_samples_per_second": 30.823,
+      "eval_steps_per_second": 4.11,
+      "step": 1914
+    },
+    {
+      "epoch": 67.0,
+      "eval_accuracy_no_text": 0.9784451705142637,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9784451705142637,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12897755205631256,
+      "eval_mean_accuracy": 0.9784451705142637,
+      "eval_mean_iou": 0.48922258525713186,
+      "eval_overall_accuracy": 0.9784451705142637,
+      "eval_runtime": 2.443,
+      "eval_samples_per_second": 30.7,
+      "eval_steps_per_second": 4.093,
+      "step": 1943
+    },
+    {
+      "epoch": 68.0,
+      "eval_accuracy_no_text": 0.9669106724628387,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9669106724628387,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.13632425665855408,
+      "eval_mean_accuracy": 0.9669106724628387,
+      "eval_mean_iou": 0.48345533623141934,
+      "eval_overall_accuracy": 0.9669106724628387,
+      "eval_runtime": 2.4464,
+      "eval_samples_per_second": 30.657,
+      "eval_steps_per_second": 4.088,
+      "step": 1972
+    },
+    {
+      "epoch": 68.96551724137932,
+      "grad_norm": 2.6724536418914795,
+      "learning_rate": 1e-07,
+      "loss": 0.0826,
+      "step": 2000
+    },
+    {
+      "epoch": 68.96551724137932,
+      "eval_accuracy_no_text": 0.9701784379830324,
+      "eval_accuracy_text": NaN,
+      "eval_iou_no_text": 0.9701784379830324,
+      "eval_iou_text": 0.0,
+      "eval_loss": 0.12989187240600586,
+      "eval_mean_accuracy": 0.9701784379830324,
+      "eval_mean_iou": 0.4850892189915162,
+      "eval_overall_accuracy": 0.9701784379830324,
+      "eval_runtime": 2.4612,
+      "eval_samples_per_second": 30.473,
+      "eval_steps_per_second": 4.063,
+      "step": 2000
+    },
+    {
+      "epoch": 68.96551724137932,
+      "step": 2000,
+      "total_flos": 2.7210398151632486e+17,
+      "train_loss": 0.11668173718452454,
+      "train_runtime": 724.9682,
+      "train_samples_per_second": 22.07,
+      "train_steps_per_second": 2.759
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 2000,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 69,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.7210398151632486e+17,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}