10 27 11

Wei Liu

PeterV09

https://vpeterv.github.io

AI & ML interests

Machine Learning, Natural Language Processing

Recent Activity

upvoted a paper 3 days ago

START: Self-taught Reasoner with Tools

upvoted a paper 5 days ago

Language Models can Self-Improve at State-Value Estimation for Better Search

upvoted a paper 6 days ago

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

View all activity

Organizations

PeterV09's activity

upvoted a paper 3 days ago

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published 4 days ago • 78

upvoted a paper 5 days ago

Language Models can Self-Improve at State-Value Estimation for Better Search

Paper • 2503.02878 • Published 6 days ago • 7

upvoted a paper 6 days ago

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

Paper • 2503.00808 • Published 8 days ago • 52

upvoted a paper 18 days ago

MoM: Linear Sequence Modeling with Mixture-of-Memories

Paper • 2502.13685 • Published 19 days ago • 33

upvoted a paper 25 days ago

LASP-2: Rethinking Sequence Parallelism for Linear Attention and Its Hybrid

Paper • 2502.07563 • Published 27 days ago • 24

commented a paper 26 days ago

CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction

Paper • 2502.07316 • Published 27 days ago • 47 •

upvoted a paper 26 days ago

CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction

Paper • 2502.07316 • Published 27 days ago • 47

upvoted a paper about 2 months ago

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

Paper • 2501.12895 • Published Jan 22 • 56

updated a model about 2 months ago

RL4Reasoning/dart-math-prop2diff-v1-1e-5

Updated Jan 20 • 7

published a model about 2 months ago

RL4Reasoning/dart-math-prop2diff-v1-1e-5

Updated Jan 20 • 7

updated a model about 2 months ago

RL4Reasoning/dart-math-prop2diff-v1

Updated Jan 15 • 16 • 1

published a model about 2 months ago

RL4Reasoning/dart-math-prop2diff-v1

Updated Jan 15 • 16 • 1

updated 4 models about 2 months ago

liked a model about 2 months ago

MiniMaxAI/MiniMax-Text-01

Text Generation • Updated 14 days ago • 1.63k • 545

updated 2 datasets about 2 months ago

hkustnlpcot2/Math-Level-1-5

Viewer • Updated Jan 14 • 11.5k • 14

hkustnlpcot2/Math-Level-5

Viewer • Updated Jan 14 • 3.36k • 19

upvoted a paper 2 months ago

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos

Paper • 2501.04001 • Published Jan 7 • 43