nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

pythia-1.4b-dpo-full / runs /Jul08_06-23-29_42dbe5cf9ed4

Commit History

End of training

b721412
verified

nnheui commited on Jul 8, 2024

Model save

c78836d
verified

nnheui commited on Jul 8, 2024

Training in progress, step 500

f6046e2
verified

nnheui commited on Jul 8, 2024

Training in progress, step 400

f07cd45
verified

nnheui commited on Jul 8, 2024

Training in progress, step 300

712fbd9
verified

nnheui commited on Jul 8, 2024

Training in progress, step 200

522873d
verified

nnheui commited on Jul 8, 2024

Training in progress, step 100

bf4da9e
verified

nnheui commited on Jul 8, 2024