PKU-Alignment
/

beaver-7b-unified-cost

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-unified-cost / README.md

Commit History

Update README.md

83c5825

XuehaiPan commited on Apr 20