Upload tokenizer (#4)

Files changed (2) hide show

merges.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-#version: 0.2
 Ġ Ġ
 ĠĠ ĠĠ
 ĠĠĠĠ ĠĠĠĠ

+#version: 0.2 - Trained by `huggingface/tokenizers`
 Ġ Ġ
 ĠĠ ĠĠ
 ĠĠĠĠ ĠĠĠĠ

tokenizer.json CHANGED Viewed

@@ -205,7 +205,6 @@
     "continuing_subword_prefix": null,
     "end_of_word_suffix": null,
     "fuse_unk": false,
-    "byte_fallback": false,
     "vocab": {
       "<|endoftext|>": 0,
       "<fim_prefix>": 1,

     "continuing_subword_prefix": null,
     "end_of_word_suffix": null,
     "fuse_unk": false,
     "vocab": {
       "<|endoftext|>": 0,
       "<fim_prefix>": 1,