CharlesLi
/

OpenELM-1_1B-DPO-full-max-12-reward

Text Generation

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

OpenELM-1_1B-DPO-full-max-12-reward / runs /Oct07_09-41-49_xe8545-a100-15

1 contributor

History: 1 commit

This model has 1 file scanned as suspicious.

CharlesLi's picture

Model save

5f0bd88 verified 16 days ago

events.out.tfevents.1728287947.xe8545-a100-15.1100288.0

226 kB
LFS

Model save 16 days ago