anhvu2501
/

news-summarization-finetuned-mistral-7b

Generated from Trainer

Model card Files Files and versions Community

anhvu2501 commited on Apr 22

Commit

26058ec

•

1 Parent(s): 99e3da5

End of training

Files changed (1) hide show

README.md +16 -1

README.md CHANGED Viewed

@@ -6,6 +6,8 @@ tags:
 - sft
 - generated_from_trainer
 base_model: mistralai/Mistral-7B-Instruct-v0.2
 model-index:
 - name: news-summarization-finetuned-mistral-7b
   results: []
@@ -16,7 +18,9 @@ should probably proofread and complete it, then remove this comment. -->
 # news-summarization-finetuned-mistral-7b
-This model is a fine-tuned version of [mistralai/Mistral-7B-Instruct-v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2) on an unknown dataset.
 ## Model description
@@ -44,6 +48,17 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 0.03
 - training_steps: 100
 ### Framework versions
 - PEFT 0.10.0

 - sft
 - generated_from_trainer
 base_model: mistralai/Mistral-7B-Instruct-v0.2
+datasets:
+- generator
 model-index:
 - name: news-summarization-finetuned-mistral-7b
   results: []
 # news-summarization-finetuned-mistral-7b
+This model is a fine-tuned version of [mistralai/Mistral-7B-Instruct-v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2) on the generator dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.0379
 ## Model description
 - lr_scheduler_warmup_steps: 0.03
 - training_steps: 100
+### Training results
+| Training Loss | Epoch  | Step | Validation Loss |
+|:-------------:|:------:|:----:|:---------------:|
+| 2.0808        | 0.0189 | 20   | 2.1202          |
+| 2.1524        | 0.0378 | 40   | 2.0725          |
+| 2.0165        | 0.0567 | 60   | 2.0478          |
+| 2.047         | 0.0756 | 80   | 2.0444          |
+| 2.0404        | 0.0945 | 100  | 2.0379          |
 ### Framework versions
 - PEFT 0.10.0