XueyingJia
/

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen-1.5b-HH-online-dpo-ground-truth-lead-xs-batch / adapter_config.json

Commit History

Training in progress, step 100

8576728
verified

XueyingJia commited on Dec 10, 2024