philschmid
/

dpo-llama-3-1-8b-math

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

dpo-llama-3-1-8b-math / model-00004-of-00004.safetensors

Commit History

Model save

f39d639
verified

philschmid HF staff commited on about 23 hours ago

Training in progress, epoch 1

f7dd99d
verified

philschmid HF staff commited on about 23 hours ago