tanliboy
/

lambda-qwen2.5-14b-dpo-test

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

lambda-qwen2.5-14b-dpo-test

Commit History

Adding Evaluation Results

ae1ed4e
verified

leaderboard-pr-bot commited on Sep 29

End of training

96607ee
verified

tanliboy commited on Sep 20

Model save

5d863b5
verified

tanliboy commited on Sep 20

initial commit

3ea4ec1
verified

tanliboy commited on Sep 20