AutoBench

non-profit

https://www.autobench.org

Activity Feed Request to join this org

AI & ML interests

Using AI to benchmark AI

Recent Activity

PeterKruger updated a Space 2 days ago

AutoBench/README

PeterKruger updated a model 2 days ago

AutoBench/AutoBench_1.0

PeterKruger new activity 5 days ago

AutoBench/AutoBench_1.0:Comparing with mt-bench

View all activity

AutoBench's activity

PeterKruger

updated a Space 2 days ago

README

😻

PeterKruger

updated a model 2 days ago

AutoBench/AutoBench_1.0

Updated 2 days ago • 2

PeterKruger

in AutoBench/AutoBench_1.0 5 days ago

Comparing with mt-bench

#3 opened 5 days ago by

PeterKruger

posted an update 5 days ago

Post

427

AutoBench 1.0 is live. The Collective-LLM-as-a-Judge model benchmark
https://huggingface.co./blog/PeterKruger/autobench

PeterKruger

in AutoBench/AutoBench_1.0 5 days ago

Pool LLM bias

#2 opened 5 days ago by

PeterKruger

Prompt analysis should be better discussed

#1 opened 5 days ago by

PeterKruger

updated a Space 5 days ago

AutoBench 1.0 Demo

🐠

Collective-Model-As-Judge LLM Benchmark

PeterKruger

updated a dataset 6 days ago

AutoBench/AutoBench_Results_20_LLMs

Preview • Updated 6 days ago • 27

PeterKruger

published a dataset 6 days ago

AutoBench/AutoBench_Results_20_LLMs

Preview • Updated 6 days ago • 27

PeterKruger

published a Space 6 days ago

README

😻

AI & ML interests

Recent Activity

Team members 1

AutoBench's activity

README

Comparing with mt-bench

Pool LLM bias

Prompt analysis should be better discussed

AutoBench 1.0 Demo

README