5 9 3

Benjamin Feuer PRO

penfever

AI & ML interests

Deep learning, computer vision, large language models, large vision language models

Recent Activity

updated a model about 16 hours ago

penfever/dpo-rewild-8b-v0.06

published a model about 16 hours ago

penfever/dpo-rewild-8b-v0.06

updated a model about 16 hours ago

penfever/dpo-rewild-8b-v0.05

View all activity

Organizations

Papers 4

models 10

datasets 84

penfever/llama-3.1-tulu-3-8b-preference-mixture-tulu-3-sft-reused-if

Viewer • Updated 6 days ago • 65.5k • 19

penfever/t3-8b-t3uf-on-policy

Viewer • Updated 6 days ago • 41.6k • 8

penfever/t3-8b-wc-onpolicy

Viewer • Updated 6 days ago • 17.2k • 6

penfever/llama-3.1-tulu-3-8b-preference-mixture-tulu-3-wildchat-if

Viewer • Updated 6 days ago • 10.8k • 17

penfever/t3-8b-t3sft-onpolicy

Viewer • Updated 6 days ago • 19.4k • 7

penfever/llama-3.1-tulu-3-8b-preference-mixture-tulu-3-sft-reused-off-policy

Viewer • Updated 6 days ago • 96.9k • 15

penfever/llama-3.1-tulu-3-8b-preference-mixture-tulu-3-persona-if

Viewer • Updated 6 days ago • 19.9k • 29

penfever/dpo-q2572b-a70b-jllm3-Harmlessness-A

Viewer • Updated 11 days ago • 270k • 13

penfever/dpo-qalfac

Viewer • Updated 11 days ago • 360k • 20

penfever/dpo-q2572b-a70b-jllm3-Readability-A

Viewer • Updated 11 days ago • 272k • 40