Training in progress, epoch 1

Files changed (6) hide show

added_tokens.json CHANGED Viewed

@@ -5,5 +5,5 @@
   "<pad>": 1,
   "<s>": 5,
   "<s>NOTUSED": 0,
-  "<unk>": 4
 }

   "<pad>": 1,
   "<s>": 5,
   "<s>NOTUSED": 0,
+  "<unk>": 3
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71d1b428302b20c3337044249bebdcc2ddbd734aa49a0b0b59a8b10a754aa5ac
 size 442581361

 version https://git-lfs.github.com/spec/v1
+oid sha256:269811464583d5545e0d6c20d830d016333c08fa249a9ce06d0ac47555392ec3
 size 442581361

sentencepiece.bpe.model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:988bc5a00281c6d210a5d34bd143d0363741a432fefe741bf71e61b1869d4314
-size 810912

 version https://git-lfs.github.com/spec/v1
+oid sha256:f98f266fdc548c94216aaadc13ffaaafacf0c8793303e2195322d954549ea261
+size 808767

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "added_tokens_decoder": {
     "0": {
       "content": "<s>NOTUSED",
-      "lstrip": false,
       "normalized": false,
-      "rstrip": false,
       "single_word": false,
       "special": true
     },
@@ -18,13 +18,13 @@
     },
     "2": {
       "content": "</s>NOTUSED",
-      "lstrip": false,
       "normalized": false,
-      "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "4": {
       "content": "<unk>",
       "lstrip": false,
       "normalized": false,
@@ -51,7 +51,7 @@
     "32004": {
       "content": "<mask>",
       "lstrip": true,
-      "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
@@ -66,9 +66,10 @@
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": "<mask>",
-  "model_max_length": 512,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "CamembertTokenizer",
   "unk_token": "<unk>"
 }

   "added_tokens_decoder": {
     "0": {
       "content": "<s>NOTUSED",
+      "lstrip": true,
       "normalized": false,
+      "rstrip": true,
       "single_word": false,
       "special": true
     },
     },
     "2": {
       "content": "</s>NOTUSED",
+      "lstrip": true,
       "normalized": false,
+      "rstrip": true,
       "single_word": false,
       "special": true
     },
+    "3": {
       "content": "<unk>",
       "lstrip": false,
       "normalized": false,
     "32004": {
       "content": "<mask>",
       "lstrip": true,
+      "normalized": true,
       "rstrip": false,
       "single_word": false,
       "special": true
   "cls_token": "<s>",
   "eos_token": "</s>",
   "mask_token": "<mask>",
+  "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sep_token": "</s>",
+  "sp_model_kwargs": {},
   "tokenizer_class": "CamembertTokenizer",
   "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:39c1df87afb0831c73c95c2e10e23848702e1e8379c991f2c25de764831ac99d
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:aafb71b133a864e0656103e7cf83a22959344313278105eff719fcdb8f7ec99a
 size 4091