Enneng Yang

EnnengYang

AI & ML interests

Machine learning, Recommendation system

Recent Activity

upvoted a paper 7 days ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

upvoted a paper 11 days ago

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

upvoted a paper 13 days ago

Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models

View all activity

Organizations

EnnengYang's activity

upvoted a paper 7 days ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published 8 days ago • 99

upvoted a paper 11 days ago

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Paper • 2501.13200 • Published 13 days ago • 61

upvoted a paper 13 days ago

Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models

Paper • 2501.11873 • Published 15 days ago • 63

upvoted a paper 21 days ago

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published 23 days ago • 89

upvoted 2 papers 28 days ago

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

Paper • 2501.03124 • Published 30 days ago • 14

Test-time Computing: from System-1 Thinking to System-2 Thinking

Paper • 2501.02497 • Published about 1 month ago • 41

upvoted a paper about 2 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 345

upvoted 3 papers 2 months ago

upvoted 2 collections 2 months ago

Qwen2.5

Collection

Qwen2.5 language models, including pretrained and instruction-tuned models of 7 sizes, including 0.5B, 1.5B, 3B, 7B, 14B, 32B, and 72B. • 45 items • Updated Nov 28, 2024 • 501

QwQ

Collection

Qwen with Questions • 2 items • Updated Nov 28, 2024 • 56

updated a collection 3 months ago

Qwen2.5

Collection

Fine-tuned Qwen2.5 models • 5 items • Updated Nov 9, 2024

upvoted a paper 3 months ago

LIBMoE: A Library for comprehensive benchmarking Mixture of Experts in Large Language Models

Paper • 2411.00918 • Published Nov 1, 2024 • 8

upvoted 2 papers 4 months ago

Baichuan-Omni Technical Report

Paper • 2410.08565 • Published Oct 11, 2024 • 85

Preserving Multi-Modal Capabilities of Pre-trained VLMs for Improving Vision-Linguistic Compositionality

Paper • 2410.05210 • Published Oct 7, 2024 • 10