lewtun
/

gemma-7b-dpo-full-ultrafeedback-beta-0.01

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

gemma-7b-dpo-full-ultrafeedback-beta-0.01

Commit History

End of training

099ea17
verified

lewtun HF staff commited on Feb 29

Model save

ee89efc
verified

lewtun HF staff commited on Feb 29

Training in progress, step 400

0388590
verified

lewtun HF staff commited on Feb 29

Training in progress, step 300

d9dd9d0
verified

lewtun HF staff commited on Feb 29

Training in progress, step 200

d2a3972
verified

lewtun HF staff commited on Feb 29

Training in progress, step 100

03ed0d3
verified

lewtun HF staff commited on Feb 29

initial commit

9907da9
verified

lewtun HF staff commited on Feb 29