Regularized Self-Play

community

AI & ML interests

None defined yet.

Recent Activity

angelahzyuan authored a paper about 2 months ago

Accelerated Preference Optimization for Large Language Model Alignment

angelahzyuan authored a paper about 2 months ago

MARS: Unleashing the Power of Variance Reduction for Training Large Models

angelahzyuan authored a paper 8 months ago

Self-Play Preference Optimization for Language Model Alignment

View all activity

RegularizedSelfPlay's activity

angelahzyuan

authored 2 papers about 2 months ago

Accelerated Preference Optimization for Large Language Model Alignment

Paper • 2410.06293 • Published Oct 8, 2024 • 5

MARS: Unleashing the Power of Variance Reduction for Training Large Models

Paper • 2411.10438 • Published Nov 15, 2024 • 13

angelahzyuan

authored a paper 8 months ago

Self-Play Preference Optimization for Language Model Alignment

Paper • 2405.00675 • Published May 1, 2024 • 25

angelahzyuan

authored 2 papers 11 months ago

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2, 2024 • 64

Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation

Paper • 2402.10210 • Published Feb 15, 2024 • 32

timxiaohangt

authored a paper over 1 year ago

Regret-Minimizing Double Oracle for Extensive-Form Games

Paper • 2304.10498 • Published Apr 20, 2023