lewtun
/

gemma-7b-dpo-full-mix1-beta-0.1-epoch-3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.1-epoch-3

Commit History

Model save

d9be7e2
verified

lewtun HF staff commited on Feb 29

Training in progress, step 100

d2043d8
verified

lewtun HF staff commited on Feb 29

initial commit

994de92
verified

lewtun HF staff commited on Feb 29