Training in progress, epoch 1

Browse files

Files changed (5) hide show

all_results.json +8 -0
pytorch_model.bin +1 -1
train_results.json +8 -0
trainer_state.json +244 -0
training_args.bin +1 -1

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 15.0,
+    "total_flos": 1.16237984421888e+18,
+    "train_loss": 0.3610760450363159,
+    "train_runtime": 974.8105,
+    "train_samples_per_second": 15.388,
+    "train_steps_per_second": 0.062
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd930314c64a015681240d36258b7023bd39c841753735b682e743092bdeb5c6
 size 343268717

 version https://git-lfs.github.com/spec/v1
+oid sha256:8365bd765d10703caedf7d6902cd1b017ac2ee0d2bcc45a6fbc3946358e0035d
 size 343268717

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 15.0,
+    "total_flos": 1.16237984421888e+18,
+    "train_loss": 0.3610760450363159,
+    "train_runtime": 974.8105,
+    "train_samples_per_second": 15.388,
+    "train_steps_per_second": 0.062
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,244 @@

+{
+  "best_metric": 0.9083333333333333,
+  "best_model_checkpoint": "vit-base-patch16-224/checkpoint-40",
+  "epoch": 15.0,
+  "eval_steps": 500,
+  "global_step": 60,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8666666666666667,
+      "eval_f1_score": 0.8224224224224224,
+      "eval_loss": 0.5036832094192505,
+      "eval_precision": 0.8150354609929079,
+      "eval_recall": 0.8666666666666667,
+      "eval_runtime": 4.0852,
+      "eval_samples_per_second": 58.748,
+      "eval_steps_per_second": 0.979,
+      "step": 4
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8708333333333333,
+      "eval_f1_score": 0.8107089829250185,
+      "eval_loss": 0.35003846883773804,
+      "eval_precision": 0.7583506944444445,
+      "eval_recall": 0.8708333333333333,
+      "eval_runtime": 4.1025,
+      "eval_samples_per_second": 58.501,
+      "eval_steps_per_second": 0.975,
+      "step": 8
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8708333333333333,
+      "eval_f1_score": 0.8107089829250185,
+      "eval_loss": 0.3154493272304535,
+      "eval_precision": 0.7583506944444445,
+      "eval_recall": 0.8708333333333333,
+      "eval_runtime": 3.9805,
+      "eval_samples_per_second": 60.295,
+      "eval_steps_per_second": 1.005,
+      "step": 12
+    },
+    {
+      "epoch": 3.75,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.5284,
+      "step": 15
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8833333333333333,
+      "eval_f1_score": 0.849658648884655,
+      "eval_loss": 0.2973836362361908,
+      "eval_precision": 0.8659207030451664,
+      "eval_recall": 0.8833333333333333,
+      "eval_runtime": 3.9445,
+      "eval_samples_per_second": 60.844,
+      "eval_steps_per_second": 1.014,
+      "step": 16
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8875,
+      "eval_f1_score": 0.8768099547511312,
+      "eval_loss": 0.2953941226005554,
+      "eval_precision": 0.873125,
+      "eval_recall": 0.8875,
+      "eval_runtime": 4.0614,
+      "eval_samples_per_second": 59.092,
+      "eval_steps_per_second": 0.985,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8958333333333334,
+      "eval_f1_score": 0.8716479619238106,
+      "eval_loss": 0.2720634639263153,
+      "eval_precision": 0.8870833333333333,
+      "eval_recall": 0.8958333333333334,
+      "eval_runtime": 4.0196,
+      "eval_samples_per_second": 59.708,
+      "eval_steps_per_second": 0.995,
+      "step": 24
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8875,
+      "eval_f1_score": 0.852667622475749,
+      "eval_loss": 0.26786690950393677,
+      "eval_precision": 0.881712962962963,
+      "eval_recall": 0.8875,
+      "eval_runtime": 4.2691,
+      "eval_samples_per_second": 56.218,
+      "eval_steps_per_second": 0.937,
+      "step": 28
+    },
+    {
+      "epoch": 7.5,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.3362,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8875,
+      "eval_f1_score": 0.852667622475749,
+      "eval_loss": 0.26340213418006897,
+      "eval_precision": 0.881712962962963,
+      "eval_recall": 0.8875,
+      "eval_runtime": 4.2103,
+      "eval_samples_per_second": 57.002,
+      "eval_steps_per_second": 0.95,
+      "step": 32
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9041666666666667,
+      "eval_f1_score": 0.8879374201787995,
+      "eval_loss": 0.25068628787994385,
+      "eval_precision": 0.8952565318162663,
+      "eval_recall": 0.9041666666666667,
+      "eval_runtime": 3.9517,
+      "eval_samples_per_second": 60.733,
+      "eval_steps_per_second": 1.012,
+      "step": 36
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9083333333333333,
+      "eval_f1_score": 0.8940810124891471,
+      "eval_loss": 0.24386708438396454,
+      "eval_precision": 0.9006296296296298,
+      "eval_recall": 0.9083333333333333,
+      "eval_runtime": 3.9449,
+      "eval_samples_per_second": 60.839,
+      "eval_steps_per_second": 1.014,
+      "step": 40
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8916666666666667,
+      "eval_f1_score": 0.8884444626028217,
+      "eval_loss": 0.25889885425567627,
+      "eval_precision": 0.8860502521300643,
+      "eval_recall": 0.8916666666666667,
+      "eval_runtime": 4.1005,
+      "eval_samples_per_second": 58.529,
+      "eval_steps_per_second": 0.975,
+      "step": 44
+    },
+    {
+      "epoch": 11.25,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.3017,
+      "step": 45
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9083333333333333,
+      "eval_f1_score": 0.9024039297513475,
+      "eval_loss": 0.24283821880817413,
+      "eval_precision": 0.9004925532625392,
+      "eval_recall": 0.9083333333333333,
+      "eval_runtime": 4.2192,
+      "eval_samples_per_second": 56.883,
+      "eval_steps_per_second": 0.948,
+      "step": 48
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.9,
+      "eval_f1_score": 0.8970256577872201,
+      "eval_loss": 0.2543129324913025,
+      "eval_precision": 0.894922622152669,
+      "eval_recall": 0.9,
+      "eval_runtime": 4.181,
+      "eval_samples_per_second": 57.402,
+      "eval_steps_per_second": 0.957,
+      "step": 52
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8958333333333334,
+      "eval_f1_score": 0.8951038120948916,
+      "eval_loss": 0.2651337683200836,
+      "eval_precision": 0.8944246031746032,
+      "eval_recall": 0.8958333333333334,
+      "eval_runtime": 3.9408,
+      "eval_samples_per_second": 60.902,
+      "eval_steps_per_second": 1.015,
+      "step": 56
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 0.0,
+      "loss": 0.278,
+      "step": 60
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.8958333333333334,
+      "eval_f1_score": 0.8951038120948916,
+      "eval_loss": 0.2636790871620178,
+      "eval_precision": 0.8944246031746032,
+      "eval_recall": 0.8958333333333334,
+      "eval_runtime": 4.1679,
+      "eval_samples_per_second": 57.584,
+      "eval_steps_per_second": 0.96,
+      "step": 60
+    },
+    {
+      "epoch": 15.0,
+      "step": 60,
+      "total_flos": 1.16237984421888e+18,
+      "train_loss": 0.3610760450363159,
+      "train_runtime": 974.8105,
+      "train_samples_per_second": 15.388,
+      "train_steps_per_second": 0.062
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.9033333333333333,
+      "eval_f1_score": 0.888913443830571,
+      "eval_loss": 0.24460919201374054,
+      "eval_precision": 0.892075919335706,
+      "eval_recall": 0.9033333333333333,
+      "eval_runtime": 4.8461,
+      "eval_samples_per_second": 61.906,
+      "eval_steps_per_second": 1.032,
+      "step": 60
+    }
+  ],
+  "logging_steps": 15,
+  "max_steps": 60,
+  "num_train_epochs": 15,
+  "save_steps": 500,
+  "total_flos": 1.16237984421888e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eaa3e0e3582edf3de3531e7851a5df83dac84f3184f3394a6f946d5d88776d56
 size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:7e3f28fa49c01ce58eb2cbd98f07b83111f96e4736164481dabe0c27dccfd18c
 size 4027