YYYYYYibo
/

two_agent_dpo_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

two_agent_dpo_iter_2

Commit History

DPO-7b-beta0.01

c84b156
verified

YYYYYYibo commited on Aug 1, 2024

Model save

a7902e5
verified

YYYYYYibo commited on Aug 1, 2024

Training in progress, step 100

35fb578
verified

YYYYYYibo commited on Jul 31, 2024

initial commit

4e4ba00
verified

YYYYYYibo commited on Jul 31, 2024