LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
10.7k
•
87
Viewer
•
Updated
•
164
•
97.9k
•
278
Viewer
•
Updated
•
541
•
12.9k
•
56
Viewer
•
Updated
•
7.79k
•
271k
•
172
Updated
•
199k
•
61
Viewer
•
Updated
•
12.1k
•
42.8k
•
325
Viewer
•
Updated
•
231k
•
135k
•
401
Viewer
•
Updated
•
1.63k
•
34.4k
•
225
Viewer
•
Updated
•
17.6k
•
362k
•
603
Viewer
•
Updated
•
60k
•
266k
•
110
Updated
•
21.9k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
263
•
17
Viewer
•
Updated
•
34.6k
•
2.52k
•
108
Viewer
•
Updated
•
95.4k
•
4.71k
•
37