XueyingJia
/

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch / runs /Dec10_16-56-43_babel-0-31

1 contributor

History: 32 commits

XueyingJia's picture

Training in progress, step 5398

9c51ae9 verified 3 months ago

events.out.tfevents.1733867809.babel-0-31.387621.0

177 kB
LFS

Training in progress, step 5398 3 months ago