PKU-Alignment
/

beaver-7b-unified-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-unified-reward / special_tokens_map.json

Commit History

Add beaver-7b-unified-reward

2408f6d

XuehaiPan commited on Apr 19