soumya13
/

GPT2_CleanDesc_MAKE_v1.4

@@ -14,10 +14,10 @@ probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Train Loss: 0.0002
-- Validation Loss: 0.0000
-- Train Accuracy: 1.0
-- Epoch: 99
 ## Model description
@@ -36,118 +36,19 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- optimizer: {'name': 'Adam', 'weight_decay': None, 'clipnorm': None, 'global_clipnorm': None, 'clipvalue': None, 'use_ema': False, 'ema_momentum': 0.99, 'ema_overwrite_frequency': None, 'jit_compile': False, 'is_legacy_optimizer': False, 'learning_rate': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 2e-05, 'decay_steps': 30900, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}}, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False}
 - training_precision: float32
 ### Training results
 | Train Loss | Validation Loss | Train Accuracy | Epoch |
 |:----------:|:---------------:|:--------------:|:-----:|
-| 2.2048     | 0.8079          | 0.7            | 0     |
-| 0.5794     | 0.4310          | 0.9            | 1     |
-| 0.3227     | 0.1878          | 0.95           | 2     |
-| 0.2545     | 0.1830          | 0.95           | 3     |
-| 0.1640     | 0.0833          | 1.0            | 4     |
-| 0.1112     | 0.0548          | 1.0            | 5     |
-| 0.0704     | 0.0321          | 1.0            | 6     |
-| 0.0464     | 0.0233          | 1.0            | 7     |
-| 0.0370     | 0.0167          | 1.0            | 8     |
-| 0.0761     | 0.0133          | 1.0            | 9     |
-| 0.0236     | 0.0110          | 1.0            | 10    |
-| 0.0276     | 0.0075          | 1.0            | 11    |
-| 0.0329     | 0.0061          | 1.0            | 12    |
-| 0.0303     | 0.0050          | 1.0            | 13    |
-| 0.0165     | 0.0040          | 1.0            | 14    |
-| 0.0104     | 0.0034          | 1.0            | 15    |
-| 0.0445     | 0.0027          | 1.0            | 16    |
-| 0.0257     | 0.0023          | 1.0            | 17    |
-| 0.0117     | 0.0020          | 1.0            | 18    |
-| 0.0319     | 0.0016          | 1.0            | 19    |
-| 0.0205     | 0.0025          | 1.0            | 20    |
-| 0.0259     | 0.0016          | 1.0            | 21    |
-| 0.0144     | 0.0010          | 1.0            | 22    |
-| 0.0151     | 0.0007          | 1.0            | 23    |
-| 0.0256     | 0.0006          | 1.0            | 24    |
-| 0.0238     | 0.0005          | 1.0            | 25    |
-| 0.0095     | 0.0004          | 1.0            | 26    |
-| 0.0143     | 0.0004          | 1.0            | 27    |
-| 0.0231     | 0.0004          | 1.0            | 28    |
-| 0.0157     | 0.0003          | 1.0            | 29    |
-| 0.0208     | 0.0003          | 1.0            | 30    |
-| 0.0086     | 0.0003          | 1.0            | 31    |
-| 0.0080     | 0.0003          | 1.0            | 32    |
-| 0.0116     | 0.0002          | 1.0            | 33    |
-| 0.0214     | 0.0002          | 1.0            | 34    |
-| 0.0077     | 0.0002          | 1.0            | 35    |
-| 0.0083     | 0.0002          | 1.0            | 36    |
-| 0.0215     | 0.0002          | 1.0            | 37    |
-| 0.0279     | 0.0002          | 1.0            | 38    |
-| 0.0011     | 0.0002          | 1.0            | 39    |
-| 0.0142     | 0.0002          | 1.0            | 40    |
-| 0.0137     | 0.0002          | 1.0            | 41    |
-| 0.0223     | 0.0001          | 1.0            | 42    |
-| 0.0053     | 0.0001          | 1.0            | 43    |
-| 0.0196     | 0.0001          | 1.0            | 44    |
-| 0.0135     | 0.0001          | 1.0            | 45    |
-| 0.0208     | 0.0001          | 1.0            | 46    |
-| 0.0206     | 0.0001          | 1.0            | 47    |
-| 0.0188     | 0.0001          | 1.0            | 48    |
-| 0.0124     | 0.0001          | 1.0            | 49    |
-| 0.0161     | 0.0001          | 1.0            | 50    |
-| 0.0125     | 0.0001          | 1.0            | 51    |
-| 0.0186     | 0.0001          | 1.0            | 52    |
-| 0.0180     | 0.0001          | 1.0            | 53    |
-| 0.0068     | 0.0001          | 1.0            | 54    |
-| 0.0118     | 0.0001          | 1.0            | 55    |
-| 0.0155     | 0.0001          | 1.0            | 56    |
-| 0.0200     | 0.0001          | 1.0            | 57    |
-| 0.0064     | 0.0001          | 1.0            | 58    |
-| 0.0117     | 0.0001          | 1.0            | 59    |
-| 0.0007     | 0.0001          | 1.0            | 60    |
-| 0.0221     | 0.0001          | 1.0            | 61    |
-| 0.0115     | 0.0001          | 1.0            | 62    |
-| 0.0062     | 0.0001          | 1.0            | 63    |
-| 0.0269     | 0.0001          | 1.0            | 64    |
-| 0.0004     | 0.0001          | 1.0            | 65    |
-| 0.0161     | 0.0001          | 1.0            | 66    |
-| 0.0295     | 0.0001          | 1.0            | 67    |
-| 0.0054     | 0.0001          | 1.0            | 68    |
-| 0.0078     | 0.0001          | 1.0            | 69    |
-| 0.0090     | 0.0001          | 1.0            | 70    |
-| 0.0053     | 0.0001          | 1.0            | 71    |
-| 0.0200     | 0.0000          | 1.0            | 72    |
-| 0.0014     | 0.0000          | 1.0            | 73    |
-| 0.0149     | 0.0000          | 1.0            | 74    |
-| 0.0054     | 0.0000          | 1.0            | 75    |
-| 0.0131     | 0.0000          | 1.0            | 76    |
-| 0.0143     | 0.0000          | 1.0            | 77    |
-| 0.0003     | 0.0000          | 1.0            | 78    |
-| 0.0077     | 0.0000          | 1.0            | 79    |
-| 0.0181     | 0.0000          | 1.0            | 80    |
-| 0.0179     | 0.0000          | 1.0            | 81    |
-| 0.0046     | 0.0000          | 1.0            | 82    |
-| 0.0045     | 0.0000          | 1.0            | 83    |
-| 0.0044     | 0.0000          | 1.0            | 84    |
-| 0.0046     | 0.0000          | 1.0            | 85    |
-| 0.0086     | 0.0000          | 1.0            | 86    |
-| 0.0126     | 0.0000          | 1.0            | 87    |
-| 0.0103     | 0.0000          | 1.0            | 88    |
-| 0.0144     | 0.0000          | 1.0            | 89    |
-| 0.0122     | 0.0000          | 1.0            | 90    |
-| 0.0124     | 0.0000          | 1.0            | 91    |
-| 0.0079     | 0.0000          | 1.0            | 92    |
-| 0.0080     | 0.0000          | 1.0            | 93    |
-| 0.0078     | 0.0000          | 1.0            | 94    |
-| 0.0042     | 0.0000          | 1.0            | 95    |
-| 0.0044     | 0.0000          | 1.0            | 96    |
-| 0.0124     | 0.0000          | 1.0            | 97    |
-| 0.0088     | 0.0000          | 1.0            | 98    |
-| 0.0002     | 0.0000          | 1.0            | 99    |
 ### Framework versions
 - Transformers 4.28.1
 - TensorFlow 2.12.0
-- Datasets 2.11.0
 - Tokenizers 0.13.3

 This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Train Loss: 2.1210
+- Validation Loss: 0.7138
+- Train Accuracy: 0.8974
+- Epoch: 0
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- optimizer: {'name': 'Adam', 'weight_decay': None, 'clipnorm': None, 'global_clipnorm': None, 'clipvalue': None, 'use_ema': False, 'ema_momentum': 0.99, 'ema_overwrite_frequency': None, 'jit_compile': False, 'is_legacy_optimizer': False, 'learning_rate': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 2e-05, 'decay_steps': 4560, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}}, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False}
 - training_precision: float32
 ### Training results
 | Train Loss | Validation Loss | Train Accuracy | Epoch |
 |:----------:|:---------------:|:--------------:|:-----:|
+| 2.1210     | 0.7138          | 0.8974         | 0     |
 ### Framework versions
 - Transformers 4.28.1
 - TensorFlow 2.12.0
+- Datasets 2.12.0
 - Tokenizers 0.13.3

config.json CHANGED Viewed

@@ -9,32 +9,32 @@
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "id2label": {
-    "0": "lincoln",
-    "1": "lexus",
-    "2": "mercedes-benz",
-    "3": "hyundai",
-    "4": "jaguar",
-    "5": "autonomous",
-    "6": "cruise",
     "7": "chrysler",
-    "8": "chevrolet",
     "9": "toyota",
-    "10": "ford",
-    "11": "nissan"
   },
   "initializer_range": 0.02,
   "label2id": {
-    "autonomous": 5,
-    "chevrolet": 8,
     "chrysler": 7,
-    "cruise": 6,
-    "ford": 10,
-    "hyundai": 3,
-    "jaguar": 4,
-    "lexus": 1,
-    "lincoln": 0,
-    "mercedes-benz": 2,
-    "nissan": 11,
     "toyota": 9
   },
   "layer_norm_epsilon": 1e-05,

   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "id2label": {
+    "0": "mercedes-benz",
+    "1": "hyundai",
+    "2": "nissan",
+    "3": "cruise",
+    "4": "chevrolet",
+    "5": "lexus",
+    "6": "ford",
     "7": "chrysler",
+    "8": "autonomous",
     "9": "toyota",
+    "10": "lincoln",
+    "11": "jaguar"
   },
   "initializer_range": 0.02,
   "label2id": {
+    "autonomous": 8,
+    "chevrolet": 4,
     "chrysler": 7,
+    "cruise": 3,
+    "ford": 6,
+    "hyundai": 1,
+    "jaguar": 11,
+    "lexus": 5,
+    "lincoln": 10,
+    "mercedes-benz": 0,
+    "nissan": 2,
     "toyota": 9
   },
   "layer_norm_epsilon": 1e-05,

tf_model.h5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bd8959773f762fce4cb10effbf5257d6676ad80aa5daeea57c7b4df1e4c7ade
 size 497983984

 version https://git-lfs.github.com/spec/v1
+oid sha256:ae755ec552657550dd81250124c62f48b9757887b7839aaa1c40a32f19d822d7
 size 497983984