End of training

Browse files

Files changed (9) hide show

README.md +82 -0
all_results.json +18 -0
config.json +57 -0
eval_results.json +13 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
train_results.json +8 -0
trainer_state.json +301 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,82 @@

+---
+library_name: transformers
+license: apache-2.0
+base_model: facebook/convnextv2-tiny-1k-224
+tags:
+- generated_from_trainer
+metrics:
+- precision
+- recall
+- f1
+- accuracy
+model-index:
+- name: convnextv2-tiny-1k-224-finetuned-barkley
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# convnextv2-tiny-1k-224-finetuned-barkley
+This model is a fine-tuned version of [facebook/convnextv2-tiny-1k-224](https://huggingface.co/facebook/convnextv2-tiny-1k-224) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0083
+- Precision: 1.0
+- Recall: 1.0
+- F1: 1.0
+- Accuracy: 1.0
+- Top1 Accuracy: 1.0
+- Error Rate: 0.0
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 32
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 30
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Precision | Recall | F1     | Accuracy | Top1 Accuracy | Error Rate |
+|:-------------:|:-----:|:----:|:---------------:|:---------:|:------:|:------:|:--------:|:-------------:|:----------:|
+| 1.4696        | 1.0   | 38   | 1.1807          | 0.7273    | 0.6513 | 0.6180 | 0.6768   | 0.6513        | 0.3232     |
+| 0.7197        | 2.0   | 76   | 0.3719          | 0.9439    | 0.9408 | 0.9404 | 0.9434   | 0.9474        | 0.0566     |
+| 0.2388        | 3.0   | 114  | 0.1489          | 0.9688    | 0.9671 | 0.9671 | 0.9716   | 0.9671        | 0.0284     |
+| 0.1048        | 4.0   | 152  | 0.0730          | 0.9868    | 0.9868 | 0.9868 | 0.9878   | 0.9868        | 0.0122     |
+| 0.1103        | 5.0   | 190  | 0.0288          | 0.9868    | 0.9868 | 0.9868 | 0.9878   | 0.9868        | 0.0122     |
+| 0.072         | 6.0   | 228  | 0.0537          | 0.9877    | 0.9868 | 0.9869 | 0.9868   | 0.9868        | 0.0132     |
+| 0.0248        | 7.0   | 266  | 0.0083          | 1.0       | 1.0    | 1.0    | 1.0      | 1.0           | 0.0        |
+| 0.0371        | 8.0   | 304  | 0.0653          | 0.9819    | 0.9803 | 0.9802 | 0.9800   | 0.9803        | 0.0200     |
+| 0.0626        | 9.0   | 342  | 0.2271          | 0.9545    | 0.9408 | 0.9404 | 0.95     | 0.9408        | 0.0500     |
+| 0.07          | 10.0  | 380  | 0.0304          | 0.9936    | 0.9934 | 0.9934 | 0.9933   | 0.9934        | 0.0067     |
+### Framework versions
+- Transformers 4.44.2
+- Pytorch 2.3.1+cu121
+- Datasets 3.0.1
+- Tokenizers 0.19.1

all_results.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 1.0,
+    "eval_error_rate": 0.0,
+    "eval_f1": 1.0,
+    "eval_loss": 0.008335741236805916,
+    "eval_precision": 1.0,
+    "eval_recall": 1.0,
+    "eval_runtime": 50.6937,
+    "eval_samples_per_second": 2.998,
+    "eval_steps_per_second": 0.375,
+    "eval_top1_accuracy": 1.0,
+    "total_flos": 3.060866577059021e+17,
+    "train_loss": 0.2909727611039814,
+    "train_runtime": 5060.0554,
+    "train_samples_per_second": 7.209,
+    "train_steps_per_second": 0.225
+}

config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "facebook/convnextv2-tiny-1k-224",
+  "architectures": [
+    "ConvNextV2ForImageClassification"
+  ],
+  "depths": [
+    3,
+    3,
+    9,
+    3
+  ],
+  "drop_path_rate": 0.0,
+  "hidden_act": "gelu",
+  "hidden_sizes": [
+    96,
+    192,
+    384,
+    768
+  ],
+  "id2label": {
+    "0": "Iinstia bijuga",
+    "1": "Mangifera indica",
+    "2": "Pterocarpus indicus",
+    "3": "Roystonea regia",
+    "4": "Tabebuia"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "Iinstia bijuga": 0,
+    "Mangifera indica": 1,
+    "Pterocarpus indicus": 2,
+    "Roystonea regia": 3,
+    "Tabebuia": 4
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "convnextv2",
+  "num_channels": 3,
+  "num_stages": 4,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "patch_size": 4,
+  "problem_type": "single_label_classification",
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.2"
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 1.0,
+    "eval_error_rate": 0.0,
+    "eval_f1": 1.0,
+    "eval_loss": 0.008335741236805916,
+    "eval_precision": 1.0,
+    "eval_recall": 1.0,
+    "eval_runtime": 50.6937,
+    "eval_samples_per_second": 2.998,
+    "eval_steps_per_second": 0.375,
+    "eval_top1_accuracy": 1.0
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3a76b0e1711782aec90d90a1907cbd4c4c5b284eb64932b6f3e6635104548b7
+size 111505052

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "crop_pct": 0.875,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ConvNextImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "shortest_edge": 224
+  }
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "total_flos": 3.060866577059021e+17,
+    "train_loss": 0.2909727611039814,
+    "train_runtime": 5060.0554,
+    "train_samples_per_second": 7.209,
+    "train_steps_per_second": 0.225
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,301 @@

+{
+  "best_metric": 0.008335741236805916,
+  "best_model_checkpoint": "convnextv2-tiny-1k-224-finetuned-barkley\\checkpoint-266",
+  "epoch": 10.0,
+  "eval_steps": 500,
+  "global_step": 380,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "train_accuracy": 0.3717105263157895
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": Infinity,
+      "learning_rate": 1.5789473684210526e-05,
+      "loss": 1.4696,
+      "step": 38
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6768426344896932,
+      "eval_error_rate": 0.3231573655103068,
+      "eval_f1": 0.6179742198967869,
+      "eval_loss": 1.1806769371032715,
+      "eval_precision": 0.7272665779298716,
+      "eval_recall": 0.6513157894736842,
+      "eval_runtime": 39.4866,
+      "eval_samples_per_second": 3.849,
+      "eval_steps_per_second": 0.481,
+      "eval_top1_accuracy": 0.6513157894736842,
+      "step": 38
+    },
+    {
+      "epoch": 2.0,
+      "train_accuracy": 0.8472222222222222
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 13.038293838500977,
+      "learning_rate": 3.24561403508772e-05,
+      "loss": 0.7197,
+      "step": 76
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9434188034188035,
+      "eval_error_rate": 0.056581196581196536,
+      "eval_f1": 0.9403973173646983,
+      "eval_loss": 0.3719189167022705,
+      "eval_precision": 0.9439213320792268,
+      "eval_recall": 0.9407894736842105,
+      "eval_runtime": 25.8579,
+      "eval_samples_per_second": 5.878,
+      "eval_steps_per_second": 0.735,
+      "eval_top1_accuracy": 0.9473684210526315,
+      "step": 76
+    },
+    {
+      "epoch": 3.0,
+      "train_accuracy": 0.9429824561403509
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 18.88597297668457,
+      "learning_rate": 4.868421052631579e-05,
+      "loss": 0.2388,
+      "step": 114
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9715686274509803,
+      "eval_error_rate": 0.02843137254901973,
+      "eval_f1": 0.9670619516200449,
+      "eval_loss": 0.14889617264270782,
+      "eval_precision": 0.9687561893444246,
+      "eval_recall": 0.9671052631578947,
+      "eval_runtime": 56.7711,
+      "eval_samples_per_second": 2.677,
+      "eval_steps_per_second": 0.335,
+      "eval_top1_accuracy": 0.9671052631578947,
+      "step": 114
+    },
+    {
+      "epoch": 4.0,
+      "train_accuracy": 0.9758771929824561
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 20.039169311523438,
+      "learning_rate": 4.834307992202729e-05,
+      "loss": 0.1048,
+      "step": 152
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9877777777777779,
+      "eval_error_rate": 0.012222222222222134,
+      "eval_f1": 0.9868421052631579,
+      "eval_loss": 0.07301948219537735,
+      "eval_precision": 0.9868421052631579,
+      "eval_recall": 0.9868421052631579,
+      "eval_runtime": 57.9769,
+      "eval_samples_per_second": 2.622,
+      "eval_steps_per_second": 0.328,
+      "eval_top1_accuracy": 0.9868421052631579,
+      "step": 152
+    },
+    {
+      "epoch": 5.0,
+      "train_accuracy": 0.9685672514619883
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 32.21807098388672,
+      "learning_rate": 4.6539961013645225e-05,
+      "loss": 0.1103,
+      "step": 190
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9877777777777779,
+      "eval_error_rate": 0.012222222222222134,
+      "eval_f1": 0.9868421052631579,
+      "eval_loss": 0.028847167268395424,
+      "eval_precision": 0.9868421052631579,
+      "eval_recall": 0.9868421052631579,
+      "eval_runtime": 55.6388,
+      "eval_samples_per_second": 2.732,
+      "eval_steps_per_second": 0.341,
+      "eval_top1_accuracy": 0.9868421052631579,
+      "step": 190
+    },
+    {
+      "epoch": 6.0,
+      "train_accuracy": 0.9824561403508771
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.3600322902202606,
+      "learning_rate": 4.468810916179337e-05,
+      "loss": 0.072,
+      "step": 228
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9867521367521368,
+      "eval_error_rate": 0.0132478632478632,
+      "eval_f1": 0.986943499272542,
+      "eval_loss": 0.053720876574516296,
+      "eval_precision": 0.9876644736842105,
+      "eval_recall": 0.9868421052631579,
+      "eval_runtime": 58.3931,
+      "eval_samples_per_second": 2.603,
+      "eval_steps_per_second": 0.325,
+      "eval_top1_accuracy": 0.9868421052631579,
+      "step": 228
+    },
+    {
+      "epoch": 7.0,
+      "train_accuracy": 0.9919590643274854
+    },
+    {
+      "epoch": 7.0,
+      "grad_norm": 0.21095441281795502,
+      "learning_rate": 4.283625730994152e-05,
+      "loss": 0.0248,
+      "step": 266
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 1.0,
+      "eval_error_rate": 0.0,
+      "eval_f1": 1.0,
+      "eval_loss": 0.008335741236805916,
+      "eval_precision": 1.0,
+      "eval_recall": 1.0,
+      "eval_runtime": 60.881,
+      "eval_samples_per_second": 2.497,
+      "eval_steps_per_second": 0.312,
+      "eval_top1_accuracy": 1.0,
+      "step": 266
+    },
+    {
+      "epoch": 8.0,
+      "train_accuracy": 0.9904970760233918
+    },
+    {
+      "epoch": 8.0,
+      "grad_norm": 65.39556121826172,
+      "learning_rate": 4.098440545808967e-05,
+      "loss": 0.0371,
+      "step": 304
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9800000000000001,
+      "eval_error_rate": 0.019999999999999907,
+      "eval_f1": 0.9801607428504544,
+      "eval_loss": 0.06527390331029892,
+      "eval_precision": 0.9818634423897581,
+      "eval_recall": 0.9802631578947368,
+      "eval_runtime": 54.5902,
+      "eval_samples_per_second": 2.784,
+      "eval_steps_per_second": 0.348,
+      "eval_top1_accuracy": 0.9802631578947368,
+      "step": 304
+    },
+    {
+      "epoch": 9.0,
+      "train_accuracy": 0.9846491228070176
+    },
+    {
+      "epoch": 9.0,
+      "grad_norm": 38.53361511230469,
+      "learning_rate": 3.9181286549707604e-05,
+      "loss": 0.0626,
+      "step": 342
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.95,
+      "eval_error_rate": 0.050000000000000044,
+      "eval_f1": 0.9404217064400131,
+      "eval_loss": 0.22711969912052155,
+      "eval_precision": 0.9544534412955467,
+      "eval_recall": 0.9407894736842105,
+      "eval_runtime": 51.6016,
+      "eval_samples_per_second": 2.946,
+      "eval_steps_per_second": 0.368,
+      "eval_top1_accuracy": 0.9407894736842105,
+      "step": 342
+    },
+    {
+      "epoch": 10.0,
+      "train_accuracy": 0.9766081871345029
+    },
+    {
+      "epoch": 10.0,
+      "grad_norm": 0.2995816767215729,
+      "learning_rate": 3.7329434697855756e-05,
+      "loss": 0.07,
+      "step": 380
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9933333333333334,
+      "eval_error_rate": 0.006666666666666599,
+      "eval_f1": 0.9934103601236665,
+      "eval_loss": 0.030387282371520996,
+      "eval_precision": 0.9935988620199147,
+      "eval_recall": 0.993421052631579,
+      "eval_runtime": 52.2379,
+      "eval_samples_per_second": 2.91,
+      "eval_steps_per_second": 0.364,
+      "eval_top1_accuracy": 0.993421052631579,
+      "step": 380
+    },
+    {
+      "epoch": 10.0,
+      "step": 380,
+      "total_flos": 3.060866577059021e+17,
+      "train_loss": 0.2909727611039814,
+      "train_runtime": 5060.0554,
+      "train_samples_per_second": 7.209,
+      "train_steps_per_second": 0.225
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 1140,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 30,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3.060866577059021e+17,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de756896046cbfdebae44572e838af135f99c09e1d5933136547d9ed49aea476
+size 5176