Training in progress, epoch 1

Browse files

Files changed (8) hide show

README.md +15 -15
all_results.json +11 -11
config.json +21 -21
eval_results.json +6 -6
pytorch_model.bin +1 -1
train_results.json +6 -6
trainer_state.json +209 -497
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ base_model: microsoft/swin-tiny-patch4-window7-224
 tags:
 - generated_from_trainer
 datasets:
-- cifar10
 metrics:
 - accuracy
 model-index:
@@ -14,15 +14,15 @@ model-index:
       name: Image Classification
       type: image-classification
     dataset:
-      name: cifar10
-      type: cifar10
-      config: plain_text
       split: train
-      args: plain_text
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.973
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -30,10 +30,10 @@ should probably proofread and complete it, then remove this comment. -->
 # swin-tiny-patch4-window7-224-finetuned-eurosat
-This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on the cifar10 dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0799
-- Accuracy: 0.973
 ## Model description
@@ -67,14 +67,14 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.5238        | 1.0   | 351  | 0.1417          | 0.9512   |
-| 0.3708        | 2.0   | 703  | 0.0975          | 0.9688   |
-| 0.3201        | 2.99  | 1053 | 0.0799          | 0.973    |
 ### Framework versions
-- Transformers 4.33.0
-- Pytorch 2.0.0
-- Datasets 2.1.0
 - Tokenizers 0.13.3

 tags:
 - generated_from_trainer
 datasets:
+- imagefolder
 metrics:
 - accuracy
 model-index:
       name: Image Classification
       type: image-classification
     dataset:
+      name: imagefolder
+      type: imagefolder
+      config: default
       split: train
+      args: default
     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.9803703703703703
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 # swin-tiny-patch4-window7-224-finetuned-eurosat
+This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0592
+- Accuracy: 0.9804
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.2484        | 1.0   | 190  | 0.1036          | 0.9685   |
+| 0.219         | 2.0   | 380  | 0.0825          | 0.9730   |
+| 0.121         | 3.0   | 570  | 0.0592          | 0.9804   |
 ### Framework versions
+- Transformers 4.33.2
+- Pytorch 2.0.1+cu117
+- Datasets 2.14.5
 - Tokenizers 0.13.3

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 2.99,
-    "eval_accuracy": 0.973,
-    "eval_loss": 0.079922154545784,
-    "eval_runtime": 20.1587,
-    "eval_samples_per_second": 248.032,
-    "eval_steps_per_second": 7.788,
-    "total_flos": 3.3497451642252165e+18,
-    "train_loss": 0.5413832122217669,
-    "train_runtime": 1364.9822,
-    "train_samples_per_second": 98.902,
-    "train_steps_per_second": 0.771
 }

 {
+    "epoch": 3.0,
+    "eval_accuracy": 0.9803703703703703,
+    "eval_loss": 0.059159792959690094,
+    "eval_runtime": 4.8853,
+    "eval_samples_per_second": 552.68,
+    "eval_steps_per_second": 17.399,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.32973566536317794,
+    "train_runtime": 250.3967,
+    "train_samples_per_second": 291.138,
+    "train_steps_per_second": 2.276
 }

config.json CHANGED Viewed

@@ -17,30 +17,30 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
-    "0": "airplane",
-    "1": "automobile",
-    "2": "bird",
-    "3": "cat",
-    "4": "deer",
-    "5": "dog",
-    "6": "frog",
-    "7": "horse",
-    "8": "ship",
-    "9": "truck"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "label2id": {
-    "airplane": 0,
-    "automobile": 1,
-    "bird": 2,
-    "cat": 3,
-    "deer": 4,
-    "dog": 5,
-    "frog": 6,
-    "horse": 7,
-    "ship": 8,
-    "truck": 9
   },
   "layer_norm_eps": 1e-05,
   "mlp_ratio": 4.0,
@@ -71,7 +71,7 @@
     "stage4"
   ],
   "torch_dtype": "float32",
-  "transformers_version": "4.33.0",
   "use_absolute_embeddings": false,
   "window_size": 7
 }

   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
+    "0": "AnnualCrop",
+    "1": "Forest",
+    "2": "HerbaceousVegetation",
+    "3": "Highway",
+    "4": "Industrial",
+    "5": "Pasture",
+    "6": "PermanentCrop",
+    "7": "Residential",
+    "8": "River",
+    "9": "SeaLake"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "label2id": {
+    "AnnualCrop": 0,
+    "Forest": 1,
+    "HerbaceousVegetation": 2,
+    "Highway": 3,
+    "Industrial": 4,
+    "Pasture": 5,
+    "PermanentCrop": 6,
+    "Residential": 7,
+    "River": 8,
+    "SeaLake": 9
   },
   "layer_norm_eps": 1e-05,
   "mlp_ratio": 4.0,
     "stage4"
   ],
   "torch_dtype": "float32",
+  "transformers_version": "4.33.2",
   "use_absolute_embeddings": false,
   "window_size": 7
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.99,
-    "eval_accuracy": 0.973,
-    "eval_loss": 0.079922154545784,
-    "eval_runtime": 20.1587,
-    "eval_samples_per_second": 248.032,
-    "eval_steps_per_second": 7.788
 }

 {
+    "epoch": 3.0,
+    "eval_accuracy": 0.9803703703703703,
+    "eval_loss": 0.059159792959690094,
+    "eval_runtime": 4.8853,
+    "eval_samples_per_second": 552.68,
+    "eval_steps_per_second": 17.399
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:58fdfac218c785be2841977efb5b9e0f6eaedb03a10d45f1bd617f9360b54400
 size 110419441

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b3f83e44dcabca5ca5389693ba84eb94e0cc0c17db2be57c34ba08b9afb98ce
 size 110419441

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.99,
-    "total_flos": 3.3497451642252165e+18,
-    "train_loss": 0.5413832122217669,
-    "train_runtime": 1364.9822,
-    "train_samples_per_second": 98.902,
-    "train_steps_per_second": 0.771
 }

 {
+    "epoch": 3.0,
+    "total_flos": 1.8124066505760768e+18,
+    "train_loss": 0.32973566536317794,
+    "train_runtime": 250.3967,
+    "train_samples_per_second": 291.138,
+    "train_steps_per_second": 2.276
 }

trainer_state.json CHANGED Viewed

@@ -1,685 +1,397 @@
 {
-  "best_metric": 0.973,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-1053",
-  "epoch": 2.9936034115138592,
   "eval_steps": 500,
-  "global_step": 1053,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.03,
-      "learning_rate": 4.716981132075472e-06,
-      "loss": 2.3037,
       "step": 10
     },
     {
-      "epoch": 0.06,
-      "learning_rate": 9.433962264150944e-06,
-      "loss": 2.2484,
       "step": 20
     },
     {
-      "epoch": 0.09,
-      "learning_rate": 1.4150943396226415e-05,
-      "loss": 2.109,
       "step": 30
     },
     {
-      "epoch": 0.11,
-      "learning_rate": 1.8867924528301888e-05,
-      "loss": 1.8715,
       "step": 40
     },
     {
-      "epoch": 0.14,
-      "learning_rate": 2.358490566037736e-05,
-      "loss": 1.5984,
       "step": 50
     },
     {
-      "epoch": 0.17,
-      "learning_rate": 2.830188679245283e-05,
-      "loss": 1.323,
       "step": 60
     },
     {
-      "epoch": 0.2,
-      "learning_rate": 3.30188679245283e-05,
-      "loss": 1.1205,
       "step": 70
     },
     {
-      "epoch": 0.23,
-      "learning_rate": 3.7735849056603776e-05,
-      "loss": 0.9739,
       "step": 80
     },
     {
-      "epoch": 0.26,
-      "learning_rate": 4.245283018867925e-05,
-      "loss": 0.9502,
       "step": 90
     },
     {
-      "epoch": 0.28,
-      "learning_rate": 4.716981132075472e-05,
-      "loss": 0.8486,
       "step": 100
     },
     {
-      "epoch": 0.31,
-      "learning_rate": 4.978880675818374e-05,
-      "loss": 0.7495,
       "step": 110
     },
     {
-      "epoch": 0.34,
-      "learning_rate": 4.9260823653643085e-05,
-      "loss": 0.7036,
       "step": 120
     },
     {
-      "epoch": 0.37,
-      "learning_rate": 4.8732840549102435e-05,
-      "loss": 0.6417,
       "step": 130
     },
     {
-      "epoch": 0.4,
-      "learning_rate": 4.820485744456177e-05,
-      "loss": 0.6558,
       "step": 140
     },
     {
-      "epoch": 0.43,
-      "learning_rate": 4.767687434002112e-05,
-      "loss": 0.5976,
       "step": 150
     },
     {
-      "epoch": 0.45,
-      "learning_rate": 4.7148891235480466e-05,
-      "loss": 0.6296,
       "step": 160
     },
     {
-      "epoch": 0.48,
-      "learning_rate": 4.662090813093981e-05,
-      "loss": 0.6067,
       "step": 170
     },
     {
-      "epoch": 0.51,
-      "learning_rate": 4.609292502639916e-05,
-      "loss": 0.5513,
       "step": 180
     },
     {
-      "epoch": 0.54,
-      "learning_rate": 4.55649419218585e-05,
-      "loss": 0.5577,
       "step": 190
     },
     {
-      "epoch": 0.57,
-      "learning_rate": 4.503695881731785e-05,
-      "loss": 0.5611,
       "step": 200
     },
     {
-      "epoch": 0.6,
-      "learning_rate": 4.45089757127772e-05,
-      "loss": 0.5693,
       "step": 210
     },
     {
-      "epoch": 0.63,
-      "learning_rate": 4.398099260823654e-05,
-      "loss": 0.5354,
       "step": 220
     },
     {
-      "epoch": 0.65,
-      "learning_rate": 4.3453009503695884e-05,
-      "loss": 0.5329,
       "step": 230
     },
     {
-      "epoch": 0.68,
-      "learning_rate": 4.292502639915523e-05,
-      "loss": 0.544,
       "step": 240
     },
     {
-      "epoch": 0.71,
-      "learning_rate": 4.239704329461457e-05,
-      "loss": 0.5865,
       "step": 250
     },
     {
-      "epoch": 0.74,
-      "learning_rate": 4.186906019007392e-05,
-      "loss": 0.4998,
       "step": 260
     },
     {
-      "epoch": 0.77,
-      "learning_rate": 4.1341077085533265e-05,
-      "loss": 0.5228,
       "step": 270
     },
     {
-      "epoch": 0.8,
-      "learning_rate": 4.081309398099261e-05,
-      "loss": 0.4614,
       "step": 280
     },
     {
-      "epoch": 0.82,
-      "learning_rate": 4.028511087645195e-05,
-      "loss": 0.5211,
       "step": 290
     },
     {
-      "epoch": 0.85,
-      "learning_rate": 3.97571277719113e-05,
-      "loss": 0.5343,
       "step": 300
     },
     {
-      "epoch": 0.88,
-      "learning_rate": 3.9229144667370646e-05,
-      "loss": 0.5135,
       "step": 310
     },
     {
-      "epoch": 0.91,
-      "learning_rate": 3.870116156282999e-05,
-      "loss": 0.4749,
       "step": 320
     },
     {
-      "epoch": 0.94,
-      "learning_rate": 3.817317845828934e-05,
-      "loss": 0.4425,
       "step": 330
     },
     {
-      "epoch": 0.97,
-      "learning_rate": 3.764519535374868e-05,
-      "loss": 0.512,
       "step": 340
     },
     {
-      "epoch": 1.0,
-      "learning_rate": 3.711721224920803e-05,
-      "loss": 0.5238,
       "step": 350
     },
     {
-      "epoch": 1.0,
-      "eval_accuracy": 0.9512,
-      "eval_loss": 0.14167343080043793,
-      "eval_runtime": 20.0773,
-      "eval_samples_per_second": 249.038,
-      "eval_steps_per_second": 7.82,
-      "step": 351
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 3.658922914466738e-05,
-      "loss": 0.4826,
       "step": 360
     },
     {
-      "epoch": 1.05,
-      "learning_rate": 3.6061246040126714e-05,
-      "loss": 0.4862,
       "step": 370
     },
     {
-      "epoch": 1.08,
-      "learning_rate": 3.5533262935586064e-05,
-      "loss": 0.4651,
       "step": 380
     },
     {
-      "epoch": 1.11,
-      "learning_rate": 3.500527983104541e-05,
-      "loss": 0.4217,
       "step": 390
     },
     {
-      "epoch": 1.14,
-      "learning_rate": 3.447729672650475e-05,
-      "loss": 0.4617,
       "step": 400
     },
     {
-      "epoch": 1.17,
-      "learning_rate": 3.3949313621964095e-05,
-      "loss": 0.4409,
       "step": 410
     },
     {
-      "epoch": 1.19,
-      "learning_rate": 3.3421330517423445e-05,
-      "loss": 0.4056,
       "step": 420
     },
     {
-      "epoch": 1.22,
-      "learning_rate": 3.289334741288279e-05,
-      "loss": 0.4872,
       "step": 430
     },
     {
-      "epoch": 1.25,
-      "learning_rate": 3.236536430834213e-05,
-      "loss": 0.4484,
       "step": 440
     },
     {
-      "epoch": 1.28,
-      "learning_rate": 3.183738120380148e-05,
-      "loss": 0.4289,
       "step": 450
     },
     {
-      "epoch": 1.31,
-      "learning_rate": 3.130939809926082e-05,
-      "loss": 0.4384,
       "step": 460
     },
     {
-      "epoch": 1.34,
-      "learning_rate": 3.078141499472017e-05,
-      "loss": 0.4248,
       "step": 470
     },
     {
-      "epoch": 1.36,
-      "learning_rate": 3.0253431890179517e-05,
-      "loss": 0.4518,
       "step": 480
     },
     {
-      "epoch": 1.39,
-      "learning_rate": 2.972544878563886e-05,
-      "loss": 0.4412,
       "step": 490
     },
     {
-      "epoch": 1.42,
-      "learning_rate": 2.9197465681098207e-05,
-      "loss": 0.4597,
       "step": 500
     },
     {
-      "epoch": 1.45,
-      "learning_rate": 2.8669482576557548e-05,
-      "loss": 0.458,
       "step": 510
     },
     {
-      "epoch": 1.48,
-      "learning_rate": 2.8141499472016898e-05,
-      "loss": 0.4359,
       "step": 520
     },
     {
-      "epoch": 1.51,
-      "learning_rate": 2.7613516367476245e-05,
-      "loss": 0.4051,
       "step": 530
     },
     {
-      "epoch": 1.54,
-      "learning_rate": 2.7085533262935585e-05,
-      "loss": 0.4527,
       "step": 540
     },
     {
-      "epoch": 1.56,
-      "learning_rate": 2.6557550158394935e-05,
-      "loss": 0.4189,
       "step": 550
     },
     {
-      "epoch": 1.59,
-      "learning_rate": 2.6029567053854276e-05,
-      "loss": 0.4014,
       "step": 560
     },
     {
-      "epoch": 1.62,
-      "learning_rate": 2.5501583949313622e-05,
-      "loss": 0.4195,
       "step": 570
     },
     {
-      "epoch": 1.65,
-      "learning_rate": 2.497360084477297e-05,
-      "loss": 0.4497,
-      "step": 580
-    },
-    {
-      "epoch": 1.68,
-      "learning_rate": 2.4445617740232313e-05,
-      "loss": 0.4156,
-      "step": 590
-    },
-    {
-      "epoch": 1.71,
-      "learning_rate": 2.391763463569166e-05,
-      "loss": 0.4268,
-      "step": 600
-    },
-    {
-      "epoch": 1.73,
-      "learning_rate": 2.3389651531151003e-05,
-      "loss": 0.436,
-      "step": 610
-    },
-    {
-      "epoch": 1.76,
-      "learning_rate": 2.286166842661035e-05,
-      "loss": 0.392,
-      "step": 620
-    },
-    {
-      "epoch": 1.79,
-      "learning_rate": 2.2333685322069694e-05,
-      "loss": 0.4059,
-      "step": 630
-    },
-    {
-      "epoch": 1.82,
-      "learning_rate": 2.180570221752904e-05,
-      "loss": 0.4014,
-      "step": 640
-    },
-    {
-      "epoch": 1.85,
-      "learning_rate": 2.1277719112988384e-05,
-      "loss": 0.4304,
-      "step": 650
-    },
-    {
-      "epoch": 1.88,
-      "learning_rate": 2.074973600844773e-05,
-      "loss": 0.3908,
-      "step": 660
-    },
-    {
-      "epoch": 1.9,
-      "learning_rate": 2.0221752903907075e-05,
-      "loss": 0.3963,
-      "step": 670
-    },
-    {
-      "epoch": 1.93,
-      "learning_rate": 1.9693769799366422e-05,
-      "loss": 0.3438,
-      "step": 680
-    },
-    {
-      "epoch": 1.96,
-      "learning_rate": 1.9165786694825765e-05,
-      "loss": 0.3941,
-      "step": 690
-    },
-    {
-      "epoch": 1.99,
-      "learning_rate": 1.863780359028511e-05,
-      "loss": 0.3708,
-      "step": 700
-    },
-    {
-      "epoch": 2.0,
-      "eval_accuracy": 0.9688,
-      "eval_loss": 0.09748782962560654,
-      "eval_runtime": 20.0916,
-      "eval_samples_per_second": 248.86,
-      "eval_steps_per_second": 7.814,
-      "step": 703
-    },
-    {
-      "epoch": 2.02,
-      "learning_rate": 1.810982048574446e-05,
-      "loss": 0.3771,
-      "step": 710
-    },
-    {
-      "epoch": 2.05,
-      "learning_rate": 1.7581837381203803e-05,
-      "loss": 0.3559,
-      "step": 720
-    },
-    {
-      "epoch": 2.08,
-      "learning_rate": 1.7053854276663146e-05,
-      "loss": 0.379,
-      "step": 730
-    },
-    {
-      "epoch": 2.1,
-      "learning_rate": 1.6525871172122493e-05,
-      "loss": 0.3301,
-      "step": 740
-    },
-    {
-      "epoch": 2.13,
-      "learning_rate": 1.5997888067581837e-05,
-      "loss": 0.3691,
-      "step": 750
-    },
-    {
-      "epoch": 2.16,
-      "learning_rate": 1.5469904963041184e-05,
-      "loss": 0.3257,
-      "step": 760
-    },
-    {
-      "epoch": 2.19,
-      "learning_rate": 1.4941921858500529e-05,
-      "loss": 0.3673,
-      "step": 770
-    },
-    {
-      "epoch": 2.22,
-      "learning_rate": 1.4413938753959874e-05,
-      "loss": 0.3701,
-      "step": 780
-    },
-    {
-      "epoch": 2.25,
-      "learning_rate": 1.388595564941922e-05,
-      "loss": 0.3434,
-      "step": 790
-    },
-    {
-      "epoch": 2.27,
-      "learning_rate": 1.3357972544878563e-05,
-      "loss": 0.3811,
-      "step": 800
-    },
-    {
-      "epoch": 2.3,
-      "learning_rate": 1.2829989440337912e-05,
-      "loss": 0.3483,
-      "step": 810
-    },
-    {
-      "epoch": 2.33,
-      "learning_rate": 1.2302006335797255e-05,
-      "loss": 0.369,
-      "step": 820
-    },
-    {
-      "epoch": 2.36,
-      "learning_rate": 1.17740232312566e-05,
-      "loss": 0.4224,
-      "step": 830
-    },
-    {
-      "epoch": 2.39,
-      "learning_rate": 1.1246040126715946e-05,
-      "loss": 0.3386,
-      "step": 840
-    },
-    {
-      "epoch": 2.42,
-      "learning_rate": 1.0718057022175291e-05,
-      "loss": 0.3552,
-      "step": 850
-    },
-    {
-      "epoch": 2.44,
-      "learning_rate": 1.0190073917634636e-05,
-      "loss": 0.3818,
-      "step": 860
-    },
-    {
-      "epoch": 2.47,
-      "learning_rate": 9.662090813093982e-06,
-      "loss": 0.3485,
-      "step": 870
-    },
-    {
-      "epoch": 2.5,
-      "learning_rate": 9.134107708553327e-06,
-      "loss": 0.3713,
-      "step": 880
-    },
-    {
-      "epoch": 2.53,
-      "learning_rate": 8.606124604012672e-06,
-      "loss": 0.3233,
-      "step": 890
-    },
-    {
-      "epoch": 2.56,
-      "learning_rate": 8.078141499472017e-06,
-      "loss": 0.3931,
-      "step": 900
-    },
-    {
-      "epoch": 2.59,
-      "learning_rate": 7.5501583949313625e-06,
-      "loss": 0.3595,
-      "step": 910
-    },
-    {
-      "epoch": 2.62,
-      "learning_rate": 7.022175290390708e-06,
-      "loss": 0.368,
-      "step": 920
-    },
-    {
-      "epoch": 2.64,
-      "learning_rate": 6.494192185850054e-06,
-      "loss": 0.3494,
-      "step": 930
-    },
-    {
-      "epoch": 2.67,
-      "learning_rate": 5.966209081309398e-06,
-      "loss": 0.3388,
-      "step": 940
-    },
-    {
-      "epoch": 2.7,
-      "learning_rate": 5.438225976768744e-06,
-      "loss": 0.3311,
-      "step": 950
-    },
-    {
-      "epoch": 2.73,
-      "learning_rate": 4.910242872228089e-06,
-      "loss": 0.3335,
-      "step": 960
-    },
-    {
-      "epoch": 2.76,
-      "learning_rate": 4.382259767687434e-06,
-      "loss": 0.3763,
-      "step": 970
-    },
-    {
-      "epoch": 2.79,
-      "learning_rate": 3.854276663146779e-06,
-      "loss": 0.3199,
-      "step": 980
-    },
-    {
-      "epoch": 2.81,
-      "learning_rate": 3.326293558606125e-06,
-      "loss": 0.3904,
-      "step": 990
-    },
-    {
-      "epoch": 2.84,
-      "learning_rate": 2.79831045406547e-06,
-      "loss": 0.3893,
-      "step": 1000
-    },
-    {
-      "epoch": 2.87,
-      "learning_rate": 2.2703273495248154e-06,
-      "loss": 0.36,
-      "step": 1010
-    },
-    {
-      "epoch": 2.9,
-      "learning_rate": 1.7423442449841606e-06,
-      "loss": 0.3613,
-      "step": 1020
-    },
-    {
-      "epoch": 2.93,
-      "learning_rate": 1.2143611404435059e-06,
-      "loss": 0.3556,
-      "step": 1030
-    },
-    {
-      "epoch": 2.96,
-      "learning_rate": 6.863780359028511e-07,
-      "loss": 0.3358,
-      "step": 1040
-    },
-    {
-      "epoch": 2.99,
-      "learning_rate": 1.5839493136219642e-07,
-      "loss": 0.3201,
-      "step": 1050
-    },
-    {
-      "epoch": 2.99,
-      "eval_accuracy": 0.973,
-      "eval_loss": 0.079922154545784,
-      "eval_runtime": 20.1022,
-      "eval_samples_per_second": 248.73,
-      "eval_steps_per_second": 7.81,
-      "step": 1053
     },
     {
-      "epoch": 2.99,
-      "step": 1053,
-      "total_flos": 3.3497451642252165e+18,
-      "train_loss": 0.5413832122217669,
-      "train_runtime": 1364.9822,
-      "train_samples_per_second": 98.902,
-      "train_steps_per_second": 0.771
     }
   ],
   "logging_steps": 10,
-  "max_steps": 1053,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 3.3497451642252165e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9803703703703703,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-570",
+  "epoch": 3.0,
   "eval_steps": 500,
+  "global_step": 570,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.05,
+      "learning_rate": 8.771929824561403e-06,
+      "loss": 2.2734,
       "step": 10
     },
     {
+      "epoch": 0.11,
+      "learning_rate": 1.7543859649122806e-05,
+      "loss": 2.0923,
       "step": 20
     },
     {
+      "epoch": 0.16,
+      "learning_rate": 2.6315789473684212e-05,
+      "loss": 1.6401,
       "step": 30
     },
     {
+      "epoch": 0.21,
+      "learning_rate": 3.508771929824561e-05,
+      "loss": 0.9479,
       "step": 40
     },
     {
+      "epoch": 0.26,
+      "learning_rate": 4.3859649122807014e-05,
+      "loss": 0.5664,
       "step": 50
     },
     {
+      "epoch": 0.32,
+      "learning_rate": 4.970760233918128e-05,
+      "loss": 0.476,
       "step": 60
     },
     {
+      "epoch": 0.37,
+      "learning_rate": 4.8732943469785574e-05,
+      "loss": 0.4555,
       "step": 70
     },
     {
+      "epoch": 0.42,
+      "learning_rate": 4.7758284600389865e-05,
+      "loss": 0.3879,
       "step": 80
     },
     {
+      "epoch": 0.47,
+      "learning_rate": 4.678362573099415e-05,
+      "loss": 0.3706,
       "step": 90
     },
     {
+      "epoch": 0.53,
+      "learning_rate": 4.580896686159844e-05,
+      "loss": 0.394,
       "step": 100
     },
     {
+      "epoch": 0.58,
+      "learning_rate": 4.483430799220273e-05,
+      "loss": 0.344,
       "step": 110
     },
     {
+      "epoch": 0.63,
+      "learning_rate": 4.3859649122807014e-05,
+      "loss": 0.2958,
       "step": 120
     },
     {
+      "epoch": 0.68,
+      "learning_rate": 4.2884990253411305e-05,
+      "loss": 0.2769,
       "step": 130
     },
     {
+      "epoch": 0.74,
+      "learning_rate": 4.1910331384015596e-05,
+      "loss": 0.3316,
       "step": 140
     },
     {
+      "epoch": 0.79,
+      "learning_rate": 4.093567251461988e-05,
+      "loss": 0.2917,
       "step": 150
     },
     {
+      "epoch": 0.84,
+      "learning_rate": 3.996101364522417e-05,
+      "loss": 0.2905,
       "step": 160
     },
     {
+      "epoch": 0.89,
+      "learning_rate": 3.898635477582846e-05,
+      "loss": 0.2667,
       "step": 170
     },
     {
+      "epoch": 0.95,
+      "learning_rate": 3.8011695906432746e-05,
+      "loss": 0.2338,
       "step": 180
     },
     {
+      "epoch": 1.0,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.2484,
       "step": 190
     },
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9685185185185186,
+      "eval_loss": 0.1036255806684494,
+      "eval_runtime": 5.1297,
+      "eval_samples_per_second": 526.346,
+      "eval_steps_per_second": 16.57,
+      "step": 190
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.606237816764133e-05,
+      "loss": 0.2245,
       "step": 200
     },
     {
+      "epoch": 1.11,
+      "learning_rate": 3.508771929824561e-05,
+      "loss": 0.2082,
       "step": 210
     },
     {
+      "epoch": 1.16,
+      "learning_rate": 3.41130604288499e-05,
+      "loss": 0.2787,
       "step": 220
     },
     {
+      "epoch": 1.21,
+      "learning_rate": 3.313840155945419e-05,
+      "loss": 0.2265,
       "step": 230
     },
     {
+      "epoch": 1.26,
+      "learning_rate": 3.216374269005848e-05,
+      "loss": 0.2218,
       "step": 240
     },
     {
+      "epoch": 1.32,
+      "learning_rate": 3.118908382066277e-05,
+      "loss": 0.2426,
       "step": 250
     },
     {
+      "epoch": 1.37,
+      "learning_rate": 3.0214424951267055e-05,
+      "loss": 0.2044,
       "step": 260
     },
     {
+      "epoch": 1.42,
+      "learning_rate": 2.9239766081871346e-05,
+      "loss": 0.2025,
       "step": 270
     },
     {
+      "epoch": 1.47,
+      "learning_rate": 2.8265107212475634e-05,
+      "loss": 0.2021,
       "step": 280
     },
     {
+      "epoch": 1.53,
+      "learning_rate": 2.729044834307992e-05,
+      "loss": 0.1925,
       "step": 290
     },
     {
+      "epoch": 1.58,
+      "learning_rate": 2.6315789473684212e-05,
+      "loss": 0.2151,
       "step": 300
     },
     {
+      "epoch": 1.63,
+      "learning_rate": 2.53411306042885e-05,
+      "loss": 0.1906,
       "step": 310
     },
     {
+      "epoch": 1.68,
+      "learning_rate": 2.4366471734892787e-05,
+      "loss": 0.1787,
       "step": 320
     },
     {
+      "epoch": 1.74,
+      "learning_rate": 2.3391812865497074e-05,
+      "loss": 0.1393,
       "step": 330
     },
     {
+      "epoch": 1.79,
+      "learning_rate": 2.2417153996101365e-05,
+      "loss": 0.1516,
       "step": 340
     },
     {
+      "epoch": 1.84,
+      "learning_rate": 2.1442495126705653e-05,
+      "loss": 0.164,
       "step": 350
     },
     {
+      "epoch": 1.89,
+      "learning_rate": 2.046783625730994e-05,
+      "loss": 0.1747,
       "step": 360
     },
     {
+      "epoch": 1.95,
+      "learning_rate": 1.949317738791423e-05,
+      "loss": 0.1964,
       "step": 370
     },
     {
+      "epoch": 2.0,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.219,
       "step": 380
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9729629629629629,
+      "eval_loss": 0.08252211660146713,
+      "eval_runtime": 4.4943,
+      "eval_samples_per_second": 600.762,
+      "eval_steps_per_second": 18.913,
+      "step": 380
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.7543859649122806e-05,
+      "loss": 0.2044,
       "step": 390
     },
     {
+      "epoch": 2.11,
+      "learning_rate": 1.6569200779727097e-05,
+      "loss": 0.1499,
       "step": 400
     },
     {
+      "epoch": 2.16,
+      "learning_rate": 1.5594541910331384e-05,
+      "loss": 0.1401,
       "step": 410
     },
     {
+      "epoch": 2.21,
+      "learning_rate": 1.4619883040935673e-05,
+      "loss": 0.1596,
       "step": 420
     },
     {
+      "epoch": 2.26,
+      "learning_rate": 1.364522417153996e-05,
+      "loss": 0.163,
       "step": 430
     },
     {
+      "epoch": 2.32,
+      "learning_rate": 1.267056530214425e-05,
+      "loss": 0.1403,
       "step": 440
     },
     {
+      "epoch": 2.37,
+      "learning_rate": 1.1695906432748537e-05,
+      "loss": 0.1767,
       "step": 450
     },
     {
+      "epoch": 2.42,
+      "learning_rate": 1.0721247563352826e-05,
+      "loss": 0.134,
       "step": 460
     },
     {
+      "epoch": 2.47,
+      "learning_rate": 9.746588693957115e-06,
+      "loss": 0.1522,
       "step": 470
     },
     {
+      "epoch": 2.53,
+      "learning_rate": 8.771929824561403e-06,
+      "loss": 0.14,
       "step": 480
     },
     {
+      "epoch": 2.58,
+      "learning_rate": 7.797270955165692e-06,
+      "loss": 0.129,
       "step": 490
     },
     {
+      "epoch": 2.63,
+      "learning_rate": 6.82261208576998e-06,
+      "loss": 0.1437,
       "step": 500
     },
     {
+      "epoch": 2.68,
+      "learning_rate": 5.8479532163742686e-06,
+      "loss": 0.1594,
       "step": 510
     },
     {
+      "epoch": 2.74,
+      "learning_rate": 4.873294346978558e-06,
+      "loss": 0.1436,
       "step": 520
     },
     {
+      "epoch": 2.79,
+      "learning_rate": 3.898635477582846e-06,
+      "loss": 0.1386,
       "step": 530
     },
     {
+      "epoch": 2.84,
+      "learning_rate": 2.9239766081871343e-06,
+      "loss": 0.1363,
       "step": 540
     },
     {
+      "epoch": 2.89,
+      "learning_rate": 1.949317738791423e-06,
+      "loss": 0.105,
       "step": 550
     },
     {
+      "epoch": 2.95,
+      "learning_rate": 9.746588693957115e-07,
+      "loss": 0.1413,
       "step": 560
     },
     {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 0.121,
       "step": 570
     },
     {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9803703703703703,
+      "eval_loss": 0.059159792959690094,
+      "eval_runtime": 4.6082,
+      "eval_samples_per_second": 585.917,
+      "eval_steps_per_second": 18.446,
+      "step": 570
     },
     {
+      "epoch": 3.0,
+      "step": 570,
+      "total_flos": 1.8124066505760768e+18,
+      "train_loss": 0.32973566536317794,
+      "train_runtime": 250.3967,
+      "train_samples_per_second": 291.138,
+      "train_steps_per_second": 2.276
     }
   ],
   "logging_steps": 10,
+  "max_steps": 570,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 1.8124066505760768e+18,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:40c3316f98f195515c4a8443e601de9ed3c10d163cb3811e80f17e5b22321810
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:970cd5a0062561b5253d54acfb6e6f947d5f5a6529c933acf60a03d0c624934c
 size 4091