PleIAs
/

pleias_3b_literature

Model card Files Files and versions Community

pleias_3b_literature / tokenizer_config.json

Pclanglais's picture

Upload folder using huggingface_hub

d6eec7b verified 2 months ago

history blame contribute delete

4.21 kB

	{
	"added_tokens_decoder": {
	"0": {
	"content": "[UNK]",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"1": {
	"content": "<\|begin_of_text\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"2": {
	"content": "<\|end_of_text\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"3": {
	"content": "[PAD]",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65520": {
	"content": "<\|text\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65521": {
	"content": "<\|text_summary\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65522": {
	"content": "<\|text_narrative\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65523": {
	"content": "<\|text_enonciation\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65524": {
	"content": "<\|text_tone\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65525": {
	"content": "<\|text_genre\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65526": {
	"content": "<\|text_intertext\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65527": {
	"content": "<\|text_speech\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65528": {
	"content": "<\|text_form\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65529": {
	"content": "<\|text_protagonist\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65530": {
	"content": "<\|text_cited_person\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65531": {
	"content": "<\|text_time\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65532": {
	"content": "<\|text_diegetic_time\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65533": {
	"content": "<\|text_place\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65534": {
	"content": "<\|text_language\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"65535": {
	"content": "<\|text_previous\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	}
	},
	"additional_special_tokens": [
	"<\|text\|>",
	"<\|text_summary\|>",
	"<\|text_narrative\|>",
	"<\|text_enonciation\|>",
	"<\|text_tone\|>",
	"<\|text_genre\|>",
	"<\|text_intertext\|>",
	"<\|text_speech\|>",
	"<\|text_form\|>",
	"<\|text_protagonist\|>",
	"<\|text_cited_person\|>",
	"<\|text_time\|>",
	"<\|text_diegetic_time\|>",
	"<\|text_place\|>",
	"<\|text_language\|>",
	"<\|text_previous\|>"
	],
	"clean_up_tokenization_spaces": true,
	"model_max_length": 1000000000000000019884624838656,
	"tokenizer_class": "PreTrainedTokenizerFast"
	}