zfz1
/

deepseek-8b-orpo-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-lora / runs /Jul15_00-31-06_allegro-adams

1 contributor

History: 2 commits

zfz1's picture

End of training

1075d3a verified 4 months ago

events.out.tfevents.1721029059.allegro-adams.981573.0

32.2 kB
LFS

Training in progress, step 312 4 months ago
events.out.tfevents.1721034884.allegro-adams.981573.1

997 Bytes
LFS

End of training 4 months ago