tanliboy
/

lambda-qwen2.5-32b-dpo-test

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

lambda-qwen2.5-32b-dpo-test

Commit History

End of training

675b60d
verified

tanliboy commited on Sep 22

Model save

069da35
verified

tanliboy commited on Sep 22

initial commit

5d80ef3
verified

tanliboy commited on Sep 22