Remove <sep> from tokenizer special tokens

by gabegoodhart - opened 12 days ago

←

Files changed (3) hide show

added_tokens.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "<sep>": 49155,
   "<|end_of_role|>": 49153,
   "<|start_of_role|>": 49152,
   "<|tool_call|>": 49154

 {
   "<|end_of_role|>": 49153,
   "<|start_of_role|>": 49152,
   "<|tool_call|>": 49154

tokenizer.json CHANGED Viewed

@@ -200,15 +200,6 @@
       "rstrip": false,
       "normalized": false,
       "special": true
-    },
-    {
-      "id": 49155,
-      "content": "<sep>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": false,
-      "special": true
     }
   ],
   "normalizer": null,
@@ -244960,4 +244951,4 @@
       ]
     ]
   }
-}

       "rstrip": false,
       "normalized": false,
       "special": true
     }
   ],
   "normalizer": null,
       ]
     ]
   }
+}

tokenizer_config.json CHANGED Viewed

@@ -177,14 +177,6 @@
             "rstrip": false,
             "single_word": false,
             "special": true
-        },
-        "49155": {
-            "content": "<sep>",
-            "lstrip": false,
-            "normalized": false,
-            "rstrip": false,
-            "single_word": false,
-            "special": true
         }
     },
     "additional_special_tokens": [
@@ -204,4 +196,4 @@
     "tokenizer_class": "GPT2Tokenizer",
     "unk_token": "<|end_of_text|>",
     "vocab_size": 49152
-}

             "rstrip": false,
             "single_word": false,
             "special": true
         }
     },
     "additional_special_tokens": [
     "tokenizer_class": "GPT2Tokenizer",
     "unk_token": "<|end_of_text|>",
     "vocab_size": 49152
+}