lewtun
/

gemma-7b-dpo-full-mix2-beta-0.1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

gemma-7b-dpo-full-mix2-beta-0.1

Commit History

End of training

4b03d26
verified

lewtun HF staff commited on Feb 29

Model save

b4276b8
verified

lewtun HF staff commited on Feb 29

Training in progress, step 500

e45a60d
verified

lewtun HF staff commited on Feb 29

Training in progress, step 400

a2c5252
verified

lewtun HF staff commited on Feb 29

Training in progress, step 300

5e2ae58
verified

lewtun HF staff commited on Feb 29

Training in progress, step 200

bb98807
verified

lewtun HF staff commited on Feb 29

Training in progress, step 100

60626ac
verified

lewtun HF staff commited on Feb 29

initial commit

7a2d196
verified

lewtun HF staff commited on Feb 29