nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

pythia-1.4b-dpo-full / runs /Jul08_12-10-46_42dbe5cf9ed4 /events.out.tfevents.1720441204.42dbe5cf9ed4.850889.0

Commit History

Model save

c3d5b59
verified

nnheui commited on Jul 8, 2024

Training in progress, step 500

297141c
verified

nnheui commited on Jul 8, 2024

Training in progress, step 400

69cac67
verified

nnheui commited on Jul 8, 2024

Training in progress, step 300

a5f4f32
verified

nnheui commited on Jul 8, 2024

Training in progress, step 200

8aab6f1
verified

nnheui commited on Jul 8, 2024

Training in progress, step 100

4aba533
verified

nnheui commited on Jul 8, 2024