End of training

Browse files

Files changed (3) hide show

README.md +17 -17
generation_config.json +3 -2
runs/Dec15_09-37-28_mgrqu6ctr1702517804785-49zpx/events.out.tfevents.1702604256.mgrqu6ctr1702517804785-49zpx.139978.0 +2 -2

README.md CHANGED Viewed

@@ -1,6 +1,6 @@
 ---
-license: apache-2.0
-base_model: facebook/bart-large
 tags:
 - generated_from_trainer
 metrics:
@@ -15,14 +15,14 @@ should probably proofread and complete it, then remove this comment. -->
 # LLM_Teached_Bart
-This model is a fine-tuned version of [facebook/bart-large](https://huggingface.co/facebook/bart-large) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.6728
-- Rouge1: 0.3966
-- Rouge2: 0.1905
-- Rougel: 0.3321
-- Rougelsum: 0.3322
-- Gen Len: 19.9855
 ## Model description
@@ -54,14 +54,14 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 1.851         | 1.0   | 1250  | 1.6235          | 0.3808 | 0.1775 | 0.3177 | 0.318     | 19.9855 |
-| 1.5876        | 2.0   | 2500  | 1.5937          | 0.389  | 0.1866 | 0.3271 | 0.3274    | 19.9782 |
-| 1.3922        | 3.0   | 3750  | 1.5800          | 0.3899 | 0.182  | 0.3244 | 0.3246    | 19.9918 |
-| 1.2551        | 4.0   | 5000  | 1.6044          | 0.3852 | 0.1854 | 0.3223 | 0.3227    | 19.9982 |
-| 1.1329        | 5.0   | 6250  | 1.6191          | 0.3978 | 0.1923 | 0.3342 | 0.3344    | 19.9855 |
-| 1.042         | 6.0   | 7500  | 1.6453          | 0.3956 | 0.192  | 0.3333 | 0.3335    | 19.9864 |
-| 0.9665        | 7.0   | 8750  | 1.6554          | 0.3945 | 0.1898 | 0.331  | 0.3312    | 19.9909 |
-| 0.9206        | 8.0   | 10000 | 1.6728          | 0.3966 | 0.1905 | 0.3321 | 0.3322    | 19.9855 |
 ### Framework versions

 ---
+license: mit
+base_model: facebook/bart-large-xsum
 tags:
 - generated_from_trainer
 metrics:
 # LLM_Teached_Bart
+This model is a fine-tuned version of [facebook/bart-large-xsum](https://huggingface.co/facebook/bart-large-xsum) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.3237
+- Rouge1: 0.4756
+- Rouge2: 0.203
+- Rougel: 0.3677
+- Rougelsum: 0.3678
+- Gen Len: 41.4318
 ## Model description
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 1.6644        | 1.0   | 1250  | 1.6972          | 0.4687 | 0.2036 | 0.3619 | 0.362     | 43.4245 |
+| 1.3035        | 2.0   | 2500  | 1.6463          | 0.4762 | 0.2104 | 0.3746 | 0.3747    | 39.5091 |
+| 1.0206        | 3.0   | 3750  | 1.7278          | 0.476  | 0.2117 | 0.3743 | 0.3746    | 38.9555 |
+| 0.8224        | 4.0   | 5000  | 1.8642          | 0.477  | 0.2094 | 0.3724 | 0.3723    | 40.5182 |
+| 0.654         | 5.0   | 6250  | 1.9480          | 0.4757 | 0.2083 | 0.3717 | 0.3716    | 39.8736 |
+| 0.5302        | 6.0   | 7500  | 2.1332          | 0.4773 | 0.2062 | 0.37   | 0.3699    | 40.8309 |
+| 0.4364        | 7.0   | 8750  | 2.2474          | 0.4749 | 0.2008 | 0.3648 | 0.3648    | 42.0391 |
+| 0.3782        | 8.0   | 10000 | 2.3237          | 0.4756 | 0.203  | 0.3677 | 0.3678    | 41.4318 |
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -3,10 +3,11 @@
   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
-  "forced_bos_token_id": 0,
   "forced_eos_token_id": 2,
   "no_repeat_ngram_size": 3,
-  "num_beams": 4,
   "pad_token_id": 1,
   "transformers_version": "4.36.0"
 }

   "decoder_start_token_id": 2,
   "early_stopping": true,
   "eos_token_id": 2,
   "forced_eos_token_id": 2,
+  "max_length": 62,
+  "min_length": 11,
   "no_repeat_ngram_size": 3,
+  "num_beams": 6,
   "pad_token_id": 1,
   "transformers_version": "4.36.0"
 }

runs/Dec15_09-37-28_mgrqu6ctr1702517804785-49zpx/events.out.tfevents.1702604256.mgrqu6ctr1702517804785-49zpx.139978.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0eea60578789c241315e434deb0fd86622ae96e4a8357af0203bf6807f727421
-size 12211

 version https://git-lfs.github.com/spec/v1
+oid sha256:3030386ec3ededb0c68427bfcceaa4544231bed7f5840edef6173bffeab59661
+size 13090