39 46 211

Dongfu Jiang

DongfuJiang

https://jdf-prog.github.io/

AI & ML interests

Large Language Model, Modality Reasoning and their evaluation

Recent Activity

updated a Space about 3 hours ago

TIGER-Lab/GenAI-Arena

upvoted an article about 14 hours ago

DualPipe could be better without the Dual

upvoted a paper 1 day ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

View all activity

Organizations

DongfuJiang's activity

updated a Space about 3 hours ago

269

GenAI Arena

📈

Realtime Image/Video Gen AI Arena

upvoted an article about 14 hours ago

Article

DualPipe could be better without the Dual

•

about 17 hours ago

• 9

upvoted a paper 1 day ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published 3 days ago • 46

updated a model 1 day ago

CodeDPO/qwen25-coder-base-7b-reinforce-plus_v2_mini_processed_r1

Updated 1 day ago

published a model 1 day ago

CodeDPO/qwen25-coder-base-7b-reinforce-plus_v2_mini_processed_r1

Updated 1 day ago

updated a model 2 days ago

CodeDPO/qwen25-coder-inst-7b-reinforce-plus_v2_mini_processed_r1_cold_start

Updated 2 days ago • 17

published a model 2 days ago

CodeDPO/qwen25-coder-inst-7b-reinforce-plus_v2_mini_processed_r1_cold_start

Updated 2 days ago • 17

updated a model 2 days ago

CodeDPO/qwen25-coder-base-7b-reinforce-plus_v2_mini_processed_r1_grpo_kl

Updated 2 days ago • 17

published a model 2 days ago

CodeDPO/qwen25-coder-base-7b-reinforce-plus_v2_mini_processed_r1_grpo_kl

Updated 2 days ago • 17

liked a Space 3 days ago

207

AI Deadlines

⚡

Generate project deadlines

liked a dataset 3 days ago

facebook/natural_reasoning

Viewer • Updated 8 days ago • 1.15M • 3.78k • 254

upvoted a paper 4 days ago

MoBA: Mixture of Block Attention for Long-Context LLMs

Paper • 2502.13189 • Published 10 days ago • 12

updated a dataset 6 days ago

CodeDPO/AceCoder-SFT-500-DeepSeek-R1

Viewer • Updated 6 days ago • 491 • 29

published a dataset 6 days ago

CodeDPO/AceCoder-SFT-500-DeepSeek-R1

Viewer • Updated 6 days ago • 491 • 29

updated a model 6 days ago

CodeDPO/qwen25-coder-inst-7b-reinforce-plus_v2_mini_processed_r1

Updated 6 days ago • 28

published a model 6 days ago

CodeDPO/qwen25-coder-inst-7b-reinforce-plus_v2_mini_processed_r1

Updated 6 days ago • 28

updated a dataset 6 days ago

CodeDPO/AceCoderV2-mini-processed-qwen2.5-coder-inst

Viewer • Updated 6 days ago • 2k • 42

upvoted a paper 8 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 8 days ago • 92

updated a dataset 8 days ago

CodeDPO/AceCoderV2-150K-processed

Viewer • Updated 8 days ago • 147k • 24

published a dataset 8 days ago

CodeDPO/AceCoderV2-150K-processed

Viewer • Updated 8 days ago • 147k • 24