lewtun
/

gemma-7b-dpo-full-mix1-beta-0.05

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.05

Commit History

End of training

37c1c99
verified

lewtun HF staff commited on Feb 29

Model save

d002561
verified

lewtun HF staff commited on Feb 29

initial commit

a0e7261
verified

lewtun HF staff commited on Feb 29