THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO

2 contributors

History: 5 commits

NeoZ123's picture

Update README.md

7311e4c verified 16 days ago