Shihan Dou's picture

11 4 6

Shihan Dou

Ablustrund

·

https://shihandou.com

Ablustrund

AI & ML interests

Natural Language Processing, Large Language Models

Organizations

Ablustrund's activity

upvoted an article 8 months ago

Article

BigCodeBench: Benchmarking Large Language Models on Solving Practical and Challenging Programming Tasks

Jun 18, 2024

• 43

upvoted 2 papers 12 months ago

Secrets of RLHF in Large Language Models Part II: Reward Modeling

Paper • 2401.06080 • Published Jan 11, 2024 • 27

StepCoder: Improve Code Generation with Reinforcement Learning from Compiler Feedback

Paper • 2402.01391 • Published Feb 2, 2024 • 42

upvoted a paper over 1 year ago

Secrets of RLHF in Large Language Models Part I: PPO

Paper • 2307.04964 • Published Jul 11, 2023 • 29