karimouda commited on
Commit
06b0a44
·
verified ·
1 Parent(s): a8e184c

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +41 -7
README.md CHANGED
@@ -55,6 +55,36 @@ The large language model underwent rigorous training to excel in performing a va
55
  - Ability to deal with diverse and complex prompts
56
 
57
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
58
  ## SILMA AI
59
 
60
  [silma.ai](https://silma.ai) is a leading Generative AI startup dedicated to empowering Arabic speakers with state-of-the-art AI solutions.
@@ -86,7 +116,15 @@ pipe = pipeline(
86
  )
87
 
88
  messages = [
89
- {"role": "user", "content": "اكتب رسالة تعتذر فيها لمديري في العمل عن الحضور اليوم لأسباب مرضية."},
 
 
 
 
 
 
 
 
90
  ]
91
 
92
  outputs = pipe(messages, max_new_tokens=256)
@@ -97,13 +135,9 @@ print(assistant_response)
97
  - Response:
98
 
99
  ```text
100
- السلام عليكم ورحمة الله وبركاته
101
-
102
- أودّ أن أعتذر عن عدم الحضور إلى العمل اليوم بسبب مرضي. أشعر بالسوء الشديد وأحتاج إلى الراحة. سأعود إلى العمل فور تعافيي.
103
- شكراً لتفهمكم.
104
 
105
- مع تحياتي،
106
- [اسمك]
107
  ```
108
 
109
 
 
55
  - Ability to deal with diverse and complex prompts
56
 
57
 
58
+ ## Model Evaluation
59
+
60
+ ![benchmark-colored-2.png](https://cdn-uploads.huggingface.co/production/uploads/63d7acf73130cadcaf827e84/klEZVsWiIu2aeEG2uyOLA.png)
61
+
62
+
63
+ Dataset | exact_match | rouge1 | bleu | bertscore
64
+ ragbench-finqa-en-test | 0.000 | 0.587 | 0.321 | 0.760
65
+ ragbench-tatqa-ar-test | 0.000 | 0.484 | 0.130 | 0.774
66
+ ragbench-tatqa-en-test | 0.059 | 0.646 | 0.423 | 0.808
67
+ rag-instruct-benchmark-tester-en | 0.370 | 0.683 | 0.196 | 0.791
68
+ ragbench-expertqa-en-test |0.000 | 0.465 | 0.151 | 0.677
69
+ ragbench-msmarco-ar-test |0.000 | 0.144 | 0.096 | 0.781
70
+ sciq-ar-test |0.170 | 0.000 | 0.000 | 0.753
71
+ ragbench-covidqa-en-test |0.020 | 0.521 | 0.242 | 0.734
72
+ ragbench-emanual-ar-test |0.000 | 0.237 | 0.159 | 0.806
73
+ ragbench-finqa-ar-test |0.000 | 0.377 | 0.109 | 0.780
74
+ xquad-r-validation-en |0.120 | 0.326 | 0.041 | 0.603
75
+ ragbench-emanual-en-test |0.000 | 0.565 | 0.288 | 0.722
76
+ xquad-r-ar-validation |0.070 | 0.130 | 0.042 | 0.698
77
+ boolq-ar-test |0.450 | 0.000 | 0.000 | 0.700
78
+ ragbench-hotpotqa-en-test |0.060 | 0.732 | 0.503 | 0.837
79
+ ragbench-covidqa-ar-test |0.000 | 0.179 | 0.104 | 0.783
80
+ ragbench-msmarco-en-test |0.020 | 0.491 | 0.207 | 0.729
81
+ ### Benchmark Average Scores |0.079 | 0.386 | 0.177 | 0.749
82
+
83
+
84
+ SILMA RAG QA Benchmark Score: 0.3478
85
+
86
+
87
+
88
  ## SILMA AI
89
 
90
  [silma.ai](https://silma.ai) is a leading Generative AI startup dedicated to empowering Arabic speakers with state-of-the-art AI solutions.
 
116
  )
117
 
118
  messages = [
119
+ {"role": "user", "content": """
120
+ أجب على السؤال بناءً على السياق أدناه
121
+
122
+ السياق: تشمل الاتفاقيات رسوم حمل سنوية ثابت قدها 30 مليون جنيه إسترليني للقنوات نظراً لأن كلاً من مزوديها قادرين على تأمين دفعات إضافية إذا ما حققت هذه القنوات أهدافاً متعلقةً بالأداء. لا يوجد حالياً ما يشير إلى ما إذا كان الاتفاق الجديد يشمل محتوىً إضافياً كالفيديو عند الطلب والدقة العالية ، كذلك الذي سبق أن قدمته بي سكاي بي. وقد وافقت كل من بي سكاي بي و فيرجين ميديا على إنهاء الدعاوى القضائية بالمحكمة العليا ضد بعضهما بشأن معاليم الحمل التي تخص قنواتهما الأساسية.
123
+
124
+ السؤال: ماسم الشركة التي وافقت على إنهاء دعواها القضائية ضد بي سكاي بي بالمحكمة العليا؟
125
+
126
+ الإجابة:
127
+ """},
128
  ]
129
 
130
  outputs = pipe(messages, max_new_tokens=256)
 
135
  - Response:
136
 
137
  ```text
138
+ فيرجين ميديا
 
 
 
139
 
140
+ "وقد وافقت كل من بي سكاي بي و فيرجين ميديا على إنهاء الدعاوى القضائية بالمحكمة العليا ضد بعضهما بشأن معاليم الحمل التي تخص قنواتهما الأساسية."
 
141
  ```
142
 
143