THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO

Commit History

Update README.md

7311e4c
verified

NeoZ123 commited on 17 days ago

Update README.md

d89db22
verified

NeoZ123 commited on 17 days ago

add readme

db7b354

davidlvxin commited on 23 days ago

Upload folder using huggingface_hub

a74f280
verified

davidlvxin commited on 23 days ago

initial commit

e489903
verified

davidlvxin commited on 23 days ago