lewtun
/

gemma-7b-dpo-full-mix1-beta-0.4-epoch-3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.4-epoch-3

Commit History

End of training

18a72f8
verified

lewtun HF staff commited on Feb 29, 2024

Model save

ce6fffb
verified

lewtun HF staff commited on Feb 29, 2024

Training in progress, step 100

86f3f91
verified

lewtun HF staff commited on Feb 29, 2024

initial commit

c6732b9
verified

lewtun HF staff commited on Feb 29, 2024