rb05751
/

my_finetuned_gpt2_model

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

rb05751 commited on Sep 6, 2023

Commit

24de692

•

1 Parent(s): 216b591

End of training

Files changed (3) hide show

README.md +10 -9
generation_config.json +1 -1
pytorch_model.bin +1 -1

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
-license: apache-2.0
-base_model: distilgpt2
 tags:
 - generated_from_trainer
 model-index:
@@ -13,9 +13,9 @@ should probably proofread and complete it, then remove this comment. -->
 # my_finetuned_gpt2_model
-This model is a fine-tuned version of [distilgpt2](https://huggingface.co/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.7574
 ## Model description
@@ -34,24 +34,25 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.8166        | 1.0   | 1126 | 3.7574          |
 ### Framework versions
-- Transformers 4.32.1
 - Pytorch 2.0.1+cu118
-- Datasets 2.14.4
 - Tokenizers 0.13.3

 ---
+license: mit
+base_model: gpt2
 tags:
 - generated_from_trainer
 model-index:
 # my_finetuned_gpt2_model
+This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.4635
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 2
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.435         | 1.0   | 1126 | 3.4640          |
+| 3.3513        | 2.0   | 2252 | 3.4635          |
 ### Framework versions
+- Transformers 4.33.1
 - Pytorch 2.0.1+cu118
+- Datasets 2.14.5
 - Tokenizers 0.13.3

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.32.1"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.33.1"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:50c9f6ab6db487939e4e5c98692f00c7b541a22d68a9f2b0aca2d4ade9c9cb4b
 size 497807197

 version https://git-lfs.github.com/spec/v1
+oid sha256:23ba3d93407fafc670783c136fd66b19d25ca066990e9b36a26d1ec10b475879
 size 497807197