mostafaamiri
/

persian_llama_7B_merged

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mostafaamiri commited on Apr 23, 2024

Commit

fd9ee33

·

verified ·

1 Parent(s): 3314276

Update README.md

Files changed (1) hide show

README.md +25 -1

README.md CHANGED Viewed

@@ -7,4 +7,28 @@ language:
 metrics:
 - accuracy
 pipeline_tag: text-generation
----

 metrics:
 - accuracy
 pipeline_tag: text-generation
+---
+This model is Llama2-7B fine-tuned model which trained on farsi-wiki(approximately 180 milion token) and translated ALPACA dataset.
+We extend tokenizer by 19954 new token with BPE algorithm running on persian dataset.
+Use this code to run model on you input:
+```
+from transformers import AutoTokenizer, LlamaModelForCausalLM
+model = LlamaModelForCausalLM.from_pretrained("mostafaamiri/persian_llama_7B_merged")
+tokenizer = AutoTokenizer.from_pretrained(""mostafaamiri/persian_llama_7B_merged"")
+instruction = "برای رفتن به کوهنوردی چه وسایلی را با خود ببرم؟"
+prompt = [
+      """Below is an instruction that describes a task.
+      Write a response that appropriately completes the request.\n\n
+      ### Instruction:\n\n{instruction}\n\n\n### Response:\n\n\n"""
+]
+model.to("cuda")
+generated_ids = model.generate(**tokenizer(prompt, return_tensors='pt').to("cuda"))
+print(tokenizer.batch_decode(generated_ids)[0])
+```