End of training

Files changed (6) hide show

README.md CHANGED Viewed

@@ -3,8 +3,6 @@ license: apache-2.0
 base_model: distilbert-base-multilingual-cased
 tags:
 - generated_from_trainer
-metrics:
-- accuracy
 model-index:
 - name: distilbert-multilingual-sentiment
   results: []
@@ -17,8 +15,13 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert-base-multilingual-cased](https://huggingface.co/distilbert-base-multilingual-cased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.3550
-- Accuracy: 0.7609
 ## Model description
@@ -43,18 +46,7 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
-### Training results
-| Training Loss | Epoch | Step | Validation Loss | Accuracy |
-|:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 0.7301        | 1.0   | 1065 | 0.7257          | 0.6952   |
-| 0.4373        | 2.0   | 2130 | 0.6549          | 0.7450   |
-| 0.3726        | 3.0   | 3195 | 0.7610          | 0.7473   |
-| 0.1781        | 4.0   | 4260 | 1.0566          | 0.7581   |
-| 0.0609        | 5.0   | 5325 | 1.3550          | 0.7609   |
 ### Framework versions

 base_model: distilbert-base-multilingual-cased
 tags:
 - generated_from_trainer
 model-index:
 - name: distilbert-multilingual-sentiment
   results: []
 This model is a fine-tuned version of [distilbert-base-multilingual-cased](https://huggingface.co/distilbert-base-multilingual-cased) on the None dataset.
 It achieves the following results on the evaluation set:
+- eval_loss: 1.3619
+- eval_accuracy: 0.7435
+- eval_runtime: 25.7389
+- eval_samples_per_second: 82.715
+- eval_steps_per_second: 5.206
+- epoch: 6.0
+- step: 6390
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 8
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b6e84cbc602d4cf6deb96117f6d271ecb35a420be3e5b05924c6dcbbe0c035e
 size 541320452

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4d83f472f6f700f2f457e7a6d076530689105883b45b4ec9e494349e0565b26
 size 541320452

tmp-checkpoint-6500/config.json ADDED Viewed

+{
+  "_name_or_path": "distilbert-base-multilingual-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.2,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "Negative",
+    "1": "Neutral",
+    "2": "Positive"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "Negative": 0,
+    "Neutral": 1,
+    "Positive": 2
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.36.2",
+  "vocab_size": 119547
+}

tmp-checkpoint-6500/model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4d83f472f6f700f2f457e7a6d076530689105883b45b4ec9e494349e0565b26
+size 541320452

tmp-checkpoint-6500/optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c09aa06362d3f294bafdb75aba0cf291fb991d864934bbb3055758069561a2cc
+size 368717824

tmp-checkpoint-6500/training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f63087a3112377d66ce3d82b41fc66701944b06d4a0637eac91ef5752e0006b2
+size 4219