GeorgiaTech
/

0.0005_llama_nodpo_3iters_bs128_531lr_oldtrl_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0005_llama_nodpo_3iters_bs128_531lr_oldtrl_iter_1

Commit History

End of training

360393e
verified

ZhangShenao commited on May 12, 2024

Model save

9066f11
verified

ZhangShenao commited on May 12, 2024

Training in progress, step 100

f6d424b
verified

ZhangShenao commited on May 12, 2024

initial commit

2d94a7d
verified

ZhangShenao commited on May 12, 2024