Arian Hosseini's picture

1

Arian Hosseini

arianhosseini

·

https://arianhosseini.github.io/

AI & ML interests

large language models, reasoning, planning, systematic generalization

Recent Activity

updated a model 4 days ago

ReasoningMila/polIter_qwen2.5_math_1.5B_inst_ppo_MATH_ckpt__iter_0047__epoch_2.00_step_1504

published a model 4 days ago

ReasoningMila/polIter_qwen2.5_math_1.5B_inst_ppo_MATH_ckpt__iter_0047__epoch_2.00_step_1504

updated a dataset 7 days ago

arianhosseini/aime24

View all activity

Organizations

Papers 2

arxiv:2410.01748

arxiv:2402.06457

models 19

arianhosseini/rebecca-hansen-cadetblue

Updated May 23, 2024 • 6

arianhosseini/mary-snyder-paleturquoise

Updated May 23, 2024 • 8

arianhosseini/jeffrey-pruitt-white

Updated May 23, 2024

arianhosseini/thomas-garcia-peachpuff

Updated May 23, 2024 • 6

arianhosseini/lisa-vance-magenta

Updated May 23, 2024 • 4

arianhosseini/rachel-james-dds-deepskyblue

Updated May 23, 2024

arianhosseini/courtney-rivera-darkblue

Updated May 20, 2024

arianhosseini/jeffrey-walker-teal

Updated May 17, 2024 • 5

arianhosseini/patricia-walters-darkmagenta

Updated May 17, 2024 • 9

arianhosseini/patricia-johnson-yellow

Updated May 17, 2024

datasets 19

arianhosseini/aime24

Viewer • Updated 7 days ago • 30 • 13

arianhosseini/math250_llama3p3-70B-instruct_256samples_ver32_temp0-7

Updated 11 days ago • 8

arianhosseini/qwq_zeroshot_math7500_train_verification_cot

Viewer • Updated 14 days ago • 19k • 27

arianhosseini/llama_3.3_70B_inst_verify

Updated 25 days ago • 981

arianhosseini/llama_3.3_70B_inst_generations

Updated 26 days ago • 38

arianhosseini/hh_sft

Viewer • Updated Apr 18, 2024 • 169k • 41

arianhosseini/hh_with_prompt

Viewer • Updated Apr 18, 2024 • 169k • 43

arianhosseini/ultrafeedback_binarized_relabel1b

Viewer • Updated Apr 8, 2024 • 63.1k • 42

arianhosseini/summ_dpo1b1_ngen10_max_2ndmax

Viewer • Updated Mar 10, 2024 • 20k • 61

arianhosseini/summ_dpo1b1_ngen10_minmax

Viewer • Updated Mar 10, 2024 • 20k • 56