aisuko
/

ft-facebook-bart-large-xsum-on-samsum

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

aisuko commited on Feb 20

Commit

aacffe3

•

1 Parent(s): e863fb8

End of training

Files changed (4) hide show

README.md +8 -8
generation_config.json +4 -0
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,10 +1,10 @@
 ---
 license: mit
 tags:
 - generated_from_trainer
 metrics:
 - rouge
-base_model: facebook/bart-large-xsum
 model-index:
 - name: ft-facebook-bart-large-xsum-on-samsum
   results: []
@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/bart-large-xsum](https://huggingface.co/facebook/bart-large-xsum) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.4689
-- Rouge1: 50.9912
-- Rouge2: 25.7585
-- Rougel: 41.4197
-- Rougelsum: 46.5946
-- Gen Len: 26.8814
 ## Model description
@@ -56,7 +56,7 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| No log        | 0.22  | 100  | 1.5055          | 49.5512 | 24.5568 | 40.7039 | 45.2274   | 26.4237 |
 ### Framework versions

 ---
 license: mit
+base_model: facebook/bart-large-xsum
 tags:
 - generated_from_trainer
 metrics:
 - rouge
 model-index:
 - name: ft-facebook-bart-large-xsum-on-samsum
   results: []
 This model is a fine-tuned version of [facebook/bart-large-xsum](https://huggingface.co/facebook/bart-large-xsum) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.4691
+- Rouge1: 51.1221
+- Rouge2: 25.9275
+- Rougel: 41.5903
+- Rougelsum: 46.7354
+- Gen Len: 26.89
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| No log        | 0.22  | 100  | 1.5053          | 49.3903 | 24.5197 | 40.7578 | 45.2724   | 26.3272 |
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -1,9 +1,13 @@
 {
   "early_stopping": true,
   "forced_eos_token_id": 2,
   "max_length": 62,
   "min_length": 11,
   "no_repeat_ngram_size": 3,
   "num_beams": 6,
   "transformers_version": "4.37.2"
 }

 {
+  "bos_token_id": 0,
+  "decoder_start_token_id": 2,
   "early_stopping": true,
+  "eos_token_id": 2,
   "forced_eos_token_id": 2,
   "max_length": 62,
   "min_length": 11,
   "no_repeat_ngram_size": 3,
   "num_beams": 6,
+  "pad_token_id": 1,
   "transformers_version": "4.37.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f05d9db4b8f13febdea52447cd5e7df742bb6cae41d19d42a6c2d6a7920bdced
 size 1625422896

 version https://git-lfs.github.com/spec/v1
+oid sha256:388374e630771e997bf530aece6d276cb7a43934219134d0812ffbdf0cbfaf1b
 size 1625422896

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f99aea148d7400adf0825cfaf7d04451f2e476e698554549d4e7b1f11c41818
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ad9f76233b0c45eee265be4dbb2b5fd8493ad0e864c4bb486e6574c3b617b45
 size 4920