End of training

Browse files

Files changed (4) hide show

README.md +19 -32
model.safetensors +1 -1
runs/Feb22_22-04-28_c9c4e1100ec2/events.out.tfevents.1708639471.c9c4e1100ec2.1595.6 +2 -2
runs/Feb22_22-04-28_c9c4e1100ec2/events.out.tfevents.1708640098.c9c4e1100ec2.1595.7 +3 -0

README.md CHANGED Viewed

@@ -18,9 +18,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [Twitter/twhin-bert-large](https://huggingface.co/Twitter/twhin-bert-large) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4655
-- Accuracy: 0.8033
-- F1: 0.7707
 ## Model description
@@ -39,12 +39,12 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1.6446264239848265e-05
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 2
@@ -52,32 +52,19 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|
-| 0.9671        | 0.08  | 100  | 0.9526          | 0.6772   | 0.5469 |
-| 0.8284        | 0.15  | 200  | 0.6263          | 0.7190   | 0.6712 |
-| 0.69          | 0.23  | 300  | 0.6105          | 0.7003   | 0.6022 |
-| 0.7725        | 0.3   | 400  | 0.5843          | 0.7774   | 0.7304 |
-| 0.7058        | 0.38  | 500  | 0.5746          | 0.7774   | 0.7422 |
-| 0.7028        | 0.46  | 600  | 0.6724          | 0.7435   | 0.7204 |
-| 0.7257        | 0.53  | 700  | 0.6853          | 0.6542   | 0.6738 |
-| 0.6422        | 0.61  | 800  | 0.5631          | 0.7702   | 0.7575 |
-| 0.5796        | 0.68  | 900  | 0.6995          | 0.6376   | 0.6359 |
-| 0.6303        | 0.76  | 1000 | 0.7513          | 0.6376   | 0.6475 |
-| 0.5102        | 0.83  | 1100 | 0.6074          | 0.7269   | 0.7073 |
-| 0.589         | 0.91  | 1200 | 0.5675          | 0.7752   | 0.7327 |
-| 0.5131        | 0.99  | 1300 | 0.6960          | 0.5901   | 0.5939 |
-| 0.4298        | 1.06  | 1400 | 0.5223          | 0.7767   | 0.7384 |
-| 0.4798        | 1.14  | 1500 | 0.4950          | 0.7968   | 0.7596 |
-| 0.4033        | 1.21  | 1600 | 0.5231          | 0.7277   | 0.7069 |
-| 0.3675        | 1.29  | 1700 | 0.4929          | 0.7702   | 0.7598 |
-| 0.3561        | 1.37  | 1800 | 0.4951          | 0.7788   | 0.7509 |
-| 0.3933        | 1.44  | 1900 | 0.4655          | 0.8033   | 0.7707 |
-| 0.3836        | 1.52  | 2000 | 0.4898          | 0.7875   | 0.7594 |
-| 0.3925        | 1.59  | 2100 | 0.5211          | 0.7687   | 0.7488 |
-| 0.3484        | 1.67  | 2200 | 0.4916          | 0.7860   | 0.7588 |
-| 0.4128        | 1.75  | 2300 | 0.4786          | 0.7968   | 0.7708 |
-| 0.3847        | 1.82  | 2400 | 0.4803          | 0.7932   | 0.7651 |
-| 0.3146        | 1.9   | 2500 | 0.4805          | 0.7932   | 0.7651 |
-| 0.4201        | 1.97  | 2600 | 0.4799          | 0.7932   | 0.7651 |
 ### Framework versions

 This model is a fine-tuned version of [Twitter/twhin-bert-large](https://huggingface.co/Twitter/twhin-bert-large) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2959
+- Accuracy: 0.8934
+- F1: 0.8943
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2.0998212817984933e-05
+- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
 - num_epochs: 2
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|
+| 0.8622        | 0.15  | 100  | 0.6806          | 0.7442   | 0.6936 |
+| 0.7005        | 0.3   | 200  | 0.5887          | 0.7731   | 0.7317 |
+| 0.5556        | 0.46  | 300  | 0.4472          | 0.8242   | 0.8328 |
+| 0.462         | 0.61  | 400  | 0.4188          | 0.8509   | 0.8546 |
+| 0.4282        | 0.76  | 500  | 0.3870          | 0.8444   | 0.8498 |
+| 0.4109        | 0.91  | 600  | 0.3031          | 0.8818   | 0.8813 |
+| 0.3524        | 1.06  | 700  | 0.3483          | 0.8876   | 0.8859 |
+| 0.2896        | 1.21  | 800  | 0.3430          | 0.8725   | 0.8757 |
+| 0.2731        | 1.37  | 900  | 0.3743          | 0.8602   | 0.8659 |
+| 0.2598        | 1.52  | 1000 | 0.3246          | 0.8905   | 0.8917 |
+| 0.2954        | 1.67  | 1100 | 0.2988          | 0.8927   | 0.8942 |
+| 0.2456        | 1.82  | 1200 | 0.2981          | 0.8912   | 0.8930 |
+| 0.2428        | 1.97  | 1300 | 0.2959          | 0.8934   | 0.8943 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6801af0c8d61a960d04cc9b0d327759aecf17fa14aa2fbe7ba599948164de8d6
 size 2245906124

 version https://git-lfs.github.com/spec/v1
+oid sha256:da6e3f0a967931c91497c6b8501af11999d3ab38703ac1e70f6fb6388187dc37
 size 2245906124

runs/Feb22_22-04-28_c9c4e1100ec2/events.out.tfevents.1708639471.c9c4e1100ec2.1595.6 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ce32a1926ea43038b349b3bffd41bb0035e36689809feb6b1aacef4425de36b0
-size 9852

 version https://git-lfs.github.com/spec/v1
+oid sha256:65d221ed6f741f4488bca22d65c82d31e48f24d13b95cfa26fa2bf8199368212
+size 11784

runs/Feb22_22-04-28_c9c4e1100ec2/events.out.tfevents.1708640098.c9c4e1100ec2.1595.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5cbc72539b861624a1089ded39c763ea3425991df8c36072162e240bf336910e
+size 457