Training in progress, step 2250, checkpoint

Browse files

Files changed (7) hide show

checkpoint-2250/config.json +92 -0
checkpoint-2250/model.safetensors +3 -0
checkpoint-2250/optimizer.pt +3 -0
checkpoint-2250/rng_state.pth +3 -0
checkpoint-2250/scheduler.pt +3 -0
checkpoint-2250/trainer_state.json +165 -0
checkpoint-2250/training_args.bin +3 -0

checkpoint-2250/config.json ADDED Viewed

	@@ -0,0 +1,92 @@

+{
+  "_name_or_path": "nvidia/mit-b5",
+  "architectures": [
+    "SegformerForSemanticSegmentation"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout_prob": 0.1,
+  "decoder_hidden_size": 768,
+  "depths": [
+    3,
+    6,
+    40,
+    3
+  ],
+  "downsampling_rates": [
+    1,
+    4,
+    8,
+    16
+  ],
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_sizes": [
+    64,
+    128,
+    320,
+    512
+  ],
+  "id2label": {
+    "0": "background",
+    "1": "double_plant",
+    "2": "drydown",
+    "3": "endrow",
+    "4": "nutrient_deficiency",
+    "5": "planter_skip",
+    "6": "water",
+    "7": "waterway",
+    "8": "weed_cluster"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "background": 0,
+    "double_plant": 1,
+    "drydown": 2,
+    "endrow": 3,
+    "nutrient_deficiency": 4,
+    "planter_skip": 5,
+    "water": 6,
+    "waterway": 7,
+    "weed_cluster": 8
+  },
+  "layer_norm_eps": 1e-06,
+  "mlp_ratios": [
+    4,
+    4,
+    4,
+    4
+  ],
+  "model_type": "segformer",
+  "num_attention_heads": [
+    1,
+    2,
+    5,
+    8
+  ],
+  "num_channels": 4,
+  "num_encoder_blocks": 4,
+  "patch_sizes": [
+    7,
+    3,
+    3,
+    3
+  ],
+  "reshape_last_stage": true,
+  "semantic_loss_ignore_index": 255,
+  "sr_ratios": [
+    8,
+    4,
+    2,
+    1
+  ],
+  "strides": [
+    4,
+    2,
+    2,
+    2
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.2"
+}

checkpoint-2250/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5a7c9e0b23f21da5d0c0df2d9fe01b7b36387ced02aed77cb295ebaffdb3a05
+size 338562516

checkpoint-2250/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:99e4c20582f5d1ba20d6e101473033a5735f5b740d6979fae2b3e8fbce3aa0c7
+size 677518143

checkpoint-2250/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02e2f68ae443f87cd8b308d1de9bf381a9c5361dae9e57aad905042d7e0b6f2d
+size 14575

checkpoint-2250/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f9f829a642e00fe87154fe7e5b3f0f2bf2dc021a22e30606de0337e8dd4418c
+size 563

checkpoint-2250/trainer_state.json ADDED Viewed

	@@ -0,0 +1,165 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 2250,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2222222222222222,
+      "grad_norm": 11.793246269226074,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 3.818,
+      "step": 500
+    },
+    {
+      "epoch": 0.2222222222222222,
+      "eval_accuracy_background": 0.19581472704788175,
+      "eval_accuracy_double_plant": 0.09380215019766877,
+      "eval_accuracy_drydown": 0.7107036127331178,
+      "eval_accuracy_endrow": 0.02059395079032939,
+      "eval_accuracy_nutrient_deficiency": 0.8348166019686053,
+      "eval_accuracy_planter_skip": 0.09523015915808461,
+      "eval_accuracy_water": 0.9933604093368263,
+      "eval_accuracy_waterway": 0.5081417568068439,
+      "eval_accuracy_weed_cluster": 0.8598379016004754,
+      "eval_iou_background": 0.18808867925529232,
+      "eval_iou_double_plant": 0.06203210246822897,
+      "eval_iou_drydown": 0.40717237628074626,
+      "eval_iou_endrow": 0.0177635377630849,
+      "eval_iou_nutrient_deficiency": 0.24616684931318317,
+      "eval_iou_planter_skip": 0.08719568132734196,
+      "eval_iou_water": 0.2711830537857341,
+      "eval_iou_waterway": 0.11493665271237699,
+      "eval_iou_weed_cluster": 0.15174042308492286,
+      "eval_loss": 3.0543487071990967,
+      "eval_mean_accuracy": 0.47914458551553707,
+      "eval_mean_iou": 0.1718088173323235,
+      "eval_overall_accuracy": 0.3698257009825982,
+      "eval_runtime": 233.3045,
+      "eval_samples_per_second": 12.182,
+      "eval_steps_per_second": 1.526,
+      "step": 500
+    },
+    {
+      "epoch": 0.4444444444444444,
+      "grad_norm": 18.055360794067383,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 3.0561,
+      "step": 1000
+    },
+    {
+      "epoch": 0.4444444444444444,
+      "eval_accuracy_background": 0.33281217700519594,
+      "eval_accuracy_double_plant": 0.6079763269177568,
+      "eval_accuracy_drydown": 0.7946684041913001,
+      "eval_accuracy_endrow": 0.349301342050525,
+      "eval_accuracy_nutrient_deficiency": 0.7314999843672831,
+      "eval_accuracy_planter_skip": 0.6712138070986369,
+      "eval_accuracy_water": 0.995121665952459,
+      "eval_accuracy_waterway": 0.5701844801294333,
+      "eval_accuracy_weed_cluster": 0.5467936481137453,
+      "eval_iou_background": 0.3071003729227365,
+      "eval_iou_double_plant": 0.05692166554215038,
+      "eval_iou_drydown": 0.45070670178291583,
+      "eval_iou_endrow": 0.12562451540796912,
+      "eval_iou_nutrient_deficiency": 0.2946294028718886,
+      "eval_iou_planter_skip": 0.13924388642718094,
+      "eval_iou_water": 0.2832997795518204,
+      "eval_iou_waterway": 0.10604657522478783,
+      "eval_iou_weed_cluster": 0.21995946645651349,
+      "eval_loss": 2.7527103424072266,
+      "eval_mean_accuracy": 0.6221746484251484,
+      "eval_mean_iou": 0.2203924851319959,
+      "eval_overall_accuracy": 0.4604543823237725,
+      "eval_runtime": 234.4163,
+      "eval_samples_per_second": 12.124,
+      "eval_steps_per_second": 1.519,
+      "step": 1000
+    },
+    {
+      "epoch": 0.6666666666666666,
+      "grad_norm": 17.42981719970703,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 2.8425,
+      "step": 1500
+    },
+    {
+      "epoch": 0.6666666666666666,
+      "eval_accuracy_background": 0.3979410567243586,
+      "eval_accuracy_double_plant": 0.35090828194540236,
+      "eval_accuracy_drydown": 0.990671482434014,
+      "eval_accuracy_endrow": 0.2249281722842768,
+      "eval_accuracy_nutrient_deficiency": 0.64935174422475,
+      "eval_accuracy_planter_skip": 0.5494840964457799,
+      "eval_accuracy_water": 0.9732364233609112,
+      "eval_accuracy_waterway": 0.32217860917602775,
+      "eval_accuracy_weed_cluster": 0.4993965740432129,
+      "eval_iou_background": 0.3749426436452205,
+      "eval_iou_double_plant": 0.1311586100117858,
+      "eval_iou_drydown": 0.377378210407481,
+      "eval_iou_endrow": 0.10949437953809864,
+      "eval_iou_nutrient_deficiency": 0.3194503546667628,
+      "eval_iou_planter_skip": 0.2767050562366308,
+      "eval_iou_water": 0.33601793640817545,
+      "eval_iou_waterway": 0.17211292189101207,
+      "eval_iou_weed_cluster": 0.23999589853669023,
+      "eval_loss": 2.7259955406188965,
+      "eval_mean_accuracy": 0.5508996045154149,
+      "eval_mean_iou": 0.2596951123713175,
+      "eval_overall_accuracy": 0.5187459341357686,
+      "eval_runtime": 234.4997,
+      "eval_samples_per_second": 12.119,
+      "eval_steps_per_second": 1.518,
+      "step": 1500
+    },
+    {
+      "epoch": 0.8888888888888888,
+      "grad_norm": 18.323888778686523,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 2.812,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8888888888888888,
+      "eval_accuracy_background": 0.3444616006736896,
+      "eval_accuracy_double_plant": 0.2994677094262697,
+      "eval_accuracy_drydown": 0.9219474623777996,
+      "eval_accuracy_endrow": 0.08748836836582362,
+      "eval_accuracy_nutrient_deficiency": 0.8971747201033099,
+      "eval_accuracy_planter_skip": 0.4553112332178167,
+      "eval_accuracy_water": 0.9835769083095529,
+      "eval_accuracy_waterway": 0.3921009308045625,
+      "eval_accuracy_weed_cluster": 0.7258725441601974,
+      "eval_iou_background": 0.32680002116655066,
+      "eval_iou_double_plant": 0.1689556986493995,
+      "eval_iou_drydown": 0.4498001115160996,
+      "eval_iou_endrow": 0.07367449850616072,
+      "eval_iou_nutrient_deficiency": 0.3152010347192682,
+      "eval_iou_planter_skip": 0.28500014113702443,
+      "eval_iou_water": 0.3018250386605094,
+      "eval_iou_waterway": 0.11357719882212529,
+      "eval_iou_weed_cluster": 0.2522793183619568,
+      "eval_loss": 2.639113187789917,
+      "eval_mean_accuracy": 0.5674890530487802,
+      "eval_mean_iou": 0.25412367350434384,
+      "eval_overall_accuracy": 0.5034953329987246,
+      "eval_runtime": 234.7079,
+      "eval_samples_per_second": 12.109,
+      "eval_steps_per_second": 1.517,
+      "step": 2000
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 22500,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 2250,
+  "total_flos": 9.581014347153408e+18,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-2250/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3c8f0a5eca1cc612f308bd7fd6b8ac1dd6fdf10189506591d24427a556fb2bd
+size 4539