minhtoan commited on
Commit
3aca71b
·
1 Parent(s): c042391

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +47 -0
README.md ADDED
@@ -0,0 +1,47 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: vi
3
+ tags:
4
+ - vi
5
+ - vietnamese
6
+ - gpt2
7
+ - text-generation
8
+ - lm
9
+ - nlp
10
+ datasets:
11
+ - wikilinguage
12
+ widget:
13
+ - text: "Không phải tất cả các nguyên liệu lành mạnh đều đắt đỏ."
14
+ ---
15
+
16
+ # GPT-2
17
+
18
+ Pretrained gpt model on Vietnamese Wikilingua dataset for text generation
19
+
20
+ # How to use the model
21
+
22
+ ~~~~
23
+ from transformers import GPT2Tokenizer, GPT2LMHeadModel
24
+
25
+ tokenizer = GPT2Tokenizer.from_pretrained('minhtoan/vietnamese-gpt2-finetune')
26
+ model = GPT2LMHeadModel.from_pretrained('minhtoan/vietnamese-gpt2-finetune')
27
+
28
+ text = "Không phải tất cả các nguyên liệu lành mạnh đều đắt đỏ."
29
+ input_ids = tokenizer.encode(text, return_tensors='pt')
30
+ max_length = 100
31
+
32
+ sample_outputs = model.generate(input_ids,pad_token_id=tokenizer.eos_token_id,
33
+ do_sample=True,
34
+ max_length=max_length,
35
+ min_length=max_length,
36
+ num_return_sequences=3)
37
+
38
+ for i, sample_output in enumerate(sample_outputs):
39
+ print(">> Generated text {}\n\n{}".format(i+1, tokenizer.decode(sample_output.tolist())))
40
+ print('\n---')
41
+ ~~~~
42
+
43
+
44
+ ## Author
45
+ `
46
+ Phan Minh Toan
47
+ `