aidal
/

Persian-Mistral-7B

@@ -28,7 +28,6 @@ language:
 | base-model-7b | ARC-easy-dev     | 2         | en-1   | 0.41929 |
 | base-model-7b | ARC-easy-dev     | 80        | en-2   | 0.39122 |
 | base-model-7b | ARC-easy-dev     | 300       | en-1   | 0.34448 |
 | model         | dataset          | max_token | prompt | score   |
 |---------------|------------------|-----------|--------|---------|
 | fa-model-7b   | ARC-easy-dev     | 80        | en-1   | 0.37894 |
@@ -37,13 +36,16 @@ language:
 | fa-model-7b   | ARC-easy-dev     | 300       | fa-1   | 0.25752 |
 | fa-model-7b   | ARC-easy-dev     | 2         | fa-1   | 0.24035 |
 | model         | dataset            | max_token | prompt | score   |
 |---------------|--------------------|-----------|--------|---------|
 | base-model-7b | ARC-challenge-dev  | 80        | en-2   | 0.37123 |
 | base-model-7b | ARC-challenge-dev  | 2         | en-2   | 0.36789 |
 | base-model-7b | ARC-challenge-dev  | 2         | en-1   | 0.35451 |
 | base-model-7b | ARC-challenge-dev  | 80        | en-1   | 0.33779 |
 | model         | dataset            | max_token | prompt | score   |
 |---------------|--------------------|-----------|--------|---------|
 | fa-model-7b   | ARC-challenge-dev  | 2         | en-1   | 0.39298 |
@@ -56,15 +58,12 @@ language:
 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("aidal/Persian-Mistral-7B")
 model = AutoModelForCausalLM.from_pretrained("aidal/Persian-Mistral-7B")
 input_text = "پایتخت ایران کجاست؟"
 input_ids = tokenizer(input_text, return_tensors="pt")
 outputs = model.generate(**input_ids)
 print(tokenizer.decode(outputs[0]))
 ```
 ----
-# Training and finetuning

 | base-model-7b | ARC-easy-dev     | 2         | en-1   | 0.41929 |
 | base-model-7b | ARC-easy-dev     | 80        | en-2   | 0.39122 |
 | base-model-7b | ARC-easy-dev     | 300       | en-1   | 0.34448 |
 | model         | dataset          | max_token | prompt | score   |
 |---------------|------------------|-----------|--------|---------|
 | fa-model-7b   | ARC-easy-dev     | 80        | en-1   | 0.37894 |
 | fa-model-7b   | ARC-easy-dev     | 300       | fa-1   | 0.25752 |
 | fa-model-7b   | ARC-easy-dev     | 2         | fa-1   | 0.24035 |
+<br>
+<br>
+<br>
 | model         | dataset            | max_token | prompt | score   |
 |---------------|--------------------|-----------|--------|---------|
 | base-model-7b | ARC-challenge-dev  | 80        | en-2   | 0.37123 |
 | base-model-7b | ARC-challenge-dev  | 2         | en-2   | 0.36789 |
 | base-model-7b | ARC-challenge-dev  | 2         | en-1   | 0.35451 |
 | base-model-7b | ARC-challenge-dev  | 80        | en-1   | 0.33779 |
 | model         | dataset            | max_token | prompt | score   |
 |---------------|--------------------|-----------|--------|---------|
 | fa-model-7b   | ARC-challenge-dev  | 2         | en-1   | 0.39298 |
 ```python
 from transformers import AutoTokenizer, AutoModelForCausalLM
 tokenizer = AutoTokenizer.from_pretrained("aidal/Persian-Mistral-7B")
 model = AutoModelForCausalLM.from_pretrained("aidal/Persian-Mistral-7B")
 input_text = "پایتخت ایران کجاست؟"
 input_ids = tokenizer(input_text, return_tensors="pt")
 outputs = model.generate(**input_ids)
 print(tokenizer.decode(outputs[0]))
 ```
 ----
+# Training and finetuning