minhtoan
/

gpt2-vietnamese

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

minhtoan commited on Feb 21, 2023

Commit

3aca71b

·

1 Parent(s): c042391

Create README.md

Files changed (1) hide show

README.md +47 -0

README.md ADDED Viewed

	@@ -0,0 +1,47 @@

+---
+language: vi
+tags:
+- vi
+- vietnamese
+- gpt2
+- text-generation
+- lm
+- nlp
+datasets:
+- wikilinguage
+widget:
+- text: "Không phải tất cả các nguyên liệu lành mạnh đều đắt đỏ."
+---
+# GPT-2
+Pretrained gpt model on Vietnamese Wikilingua dataset for text generation
+# How to use the model
+~~~~
+from transformers import GPT2Tokenizer, GPT2LMHeadModel
+tokenizer = GPT2Tokenizer.from_pretrained('minhtoan/vietnamese-gpt2-finetune')
+model = GPT2LMHeadModel.from_pretrained('minhtoan/vietnamese-gpt2-finetune')
+text = "Không phải tất cả các nguyên liệu lành mạnh đều đắt đỏ."
+input_ids = tokenizer.encode(text, return_tensors='pt')
+max_length = 100
+sample_outputs = model.generate(input_ids,pad_token_id=tokenizer.eos_token_id,
+                                   do_sample=True,
+                                   max_length=max_length,
+                                   min_length=max_length,
+                                   num_return_sequences=3)
+for i, sample_output in enumerate(sample_outputs):
+    print(">> Generated text {}\n\n{}".format(i+1, tokenizer.decode(sample_output.tolist())))
+    print('\n---')
+~~~~
+## Author
+`
+Phan Minh Toan
+`