XueyingJia
/

qwen-1.5b-sft-HH-online-dpo

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen-1.5b-sft-HH-online-dpo

Commit History

Training in progress, step 500

fb79c3d
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 400

f10797e
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 300

cf7a7be
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 200

ed2c3d1
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 100

9820fc5
verified

XueyingJia commited on Dec 10, 2024

initial commit

5f2d5a7
verified

XueyingJia commited on Dec 10, 2024