philschmid
/

dpo-llama-3-1-8b-math-ep3

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

dpo-llama-3-1-8b-math-ep3 / training_args.bin

Commit History

Training in progress, epoch 1

df61d19
verified

philschmid HF staff commited on 1 day ago