Update README.md
Browse files
README.md
CHANGED
@@ -55,6 +55,36 @@ The large language model underwent rigorous training to excel in performing a va
|
|
55 |
- Ability to deal with diverse and complex prompts
|
56 |
|
57 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
58 |
## SILMA AI
|
59 |
|
60 |
[silma.ai](https://silma.ai) is a leading Generative AI startup dedicated to empowering Arabic speakers with state-of-the-art AI solutions.
|
@@ -86,7 +116,15 @@ pipe = pipeline(
|
|
86 |
)
|
87 |
|
88 |
messages = [
|
89 |
-
{"role": "user", "content": "
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
90 |
]
|
91 |
|
92 |
outputs = pipe(messages, max_new_tokens=256)
|
@@ -97,13 +135,9 @@ print(assistant_response)
|
|
97 |
- Response:
|
98 |
|
99 |
```text
|
100 |
-
|
101 |
-
|
102 |
-
أودّ أن أعتذر عن عدم الحضور إلى العمل اليوم بسبب مرضي. أشعر بالسوء الشديد وأحتاج إلى الراحة. سأعود إلى العمل فور تعافيي.
|
103 |
-
شكراً لتفهمكم.
|
104 |
|
105 |
-
|
106 |
-
[اسمك]
|
107 |
```
|
108 |
|
109 |
|
|
|
55 |
- Ability to deal with diverse and complex prompts
|
56 |
|
57 |
|
58 |
+
## Model Evaluation
|
59 |
+
|
60 |
+

|
61 |
+
|
62 |
+
|
63 |
+
Dataset | exact_match | rouge1 | bleu | bertscore
|
64 |
+
ragbench-finqa-en-test | 0.000 | 0.587 | 0.321 | 0.760
|
65 |
+
ragbench-tatqa-ar-test | 0.000 | 0.484 | 0.130 | 0.774
|
66 |
+
ragbench-tatqa-en-test | 0.059 | 0.646 | 0.423 | 0.808
|
67 |
+
rag-instruct-benchmark-tester-en | 0.370 | 0.683 | 0.196 | 0.791
|
68 |
+
ragbench-expertqa-en-test |0.000 | 0.465 | 0.151 | 0.677
|
69 |
+
ragbench-msmarco-ar-test |0.000 | 0.144 | 0.096 | 0.781
|
70 |
+
sciq-ar-test |0.170 | 0.000 | 0.000 | 0.753
|
71 |
+
ragbench-covidqa-en-test |0.020 | 0.521 | 0.242 | 0.734
|
72 |
+
ragbench-emanual-ar-test |0.000 | 0.237 | 0.159 | 0.806
|
73 |
+
ragbench-finqa-ar-test |0.000 | 0.377 | 0.109 | 0.780
|
74 |
+
xquad-r-validation-en |0.120 | 0.326 | 0.041 | 0.603
|
75 |
+
ragbench-emanual-en-test |0.000 | 0.565 | 0.288 | 0.722
|
76 |
+
xquad-r-ar-validation |0.070 | 0.130 | 0.042 | 0.698
|
77 |
+
boolq-ar-test |0.450 | 0.000 | 0.000 | 0.700
|
78 |
+
ragbench-hotpotqa-en-test |0.060 | 0.732 | 0.503 | 0.837
|
79 |
+
ragbench-covidqa-ar-test |0.000 | 0.179 | 0.104 | 0.783
|
80 |
+
ragbench-msmarco-en-test |0.020 | 0.491 | 0.207 | 0.729
|
81 |
+
### Benchmark Average Scores |0.079 | 0.386 | 0.177 | 0.749
|
82 |
+
|
83 |
+
|
84 |
+
SILMA RAG QA Benchmark Score: 0.3478
|
85 |
+
|
86 |
+
|
87 |
+
|
88 |
## SILMA AI
|
89 |
|
90 |
[silma.ai](https://silma.ai) is a leading Generative AI startup dedicated to empowering Arabic speakers with state-of-the-art AI solutions.
|
|
|
116 |
)
|
117 |
|
118 |
messages = [
|
119 |
+
{"role": "user", "content": """
|
120 |
+
أجب على السؤال بناءً على السياق أدناه
|
121 |
+
|
122 |
+
السياق: تشمل الاتفاقيات رسوم حمل سنوية ثابت قدها 30 مليون جنيه إسترليني للقنوات نظراً لأن كلاً من مزوديها قادرين على تأمين دفعات إضافية إذا ما حققت هذه القنوات أهدافاً متعلقةً بالأداء. لا يوجد حالياً ما يشير إلى ما إذا كان الاتفاق الجديد يشمل محتوىً إضافياً كالفيديو عند الطلب والدقة العالية ، كذلك الذي سبق أن قدمته بي سكاي بي. وقد وافقت كل من بي سكاي بي و فيرجين ميديا على إنهاء الدعاوى القضائية بالمحكمة العليا ضد بعضهما بشأن معاليم الحمل التي تخص قنواتهما الأساسية.
|
123 |
+
|
124 |
+
السؤال: ماسم الشركة التي وافقت على إنهاء دعواها القضائية ضد بي سكاي بي بالمحكمة العليا؟
|
125 |
+
|
126 |
+
الإجابة:
|
127 |
+
"""},
|
128 |
]
|
129 |
|
130 |
outputs = pipe(messages, max_new_tokens=256)
|
|
|
135 |
- Response:
|
136 |
|
137 |
```text
|
138 |
+
فيرجين ميديا
|
|
|
|
|
|
|
139 |
|
140 |
+
"وقد وافقت كل من بي سكاي بي و فيرجين ميديا على إنهاء الدعاوى القضائية بالمحكمة العليا ضد بعضهما بشأن معاليم الحمل التي تخص قنواتهما الأساسية."
|
|
|
141 |
```
|
142 |
|
143 |
|