lewtun
/

gemma-7b-dpo-full-mix1-beta-0.05-epoch-3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.05-epoch-3

Commit History

End of training

e16a4a1
verified

lewtun HF staff commited on Mar 1, 2024

Model save

7e36054
verified

lewtun HF staff commited on Mar 1, 2024

Training in progress, step 100

b0adb17
verified

lewtun HF staff commited on Mar 1, 2024

initial commit

a8b1d83
verified

lewtun HF staff commited on Mar 1, 2024