PKU-Alignment
/

beaver-7b-v2.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

Commit History

Update README.md

05adcfb
verified

XuehaiPan commited on May 9

Update README.md

26c2a71

XuehaiPan commited on Apr 20

Add beaver-7b-v2.0

9d7ed2a

XuehaiPan commited on Apr 19

initial commit

9669f02
verified

XuehaiPan commited on Apr 19