chenggong1995
/

OLMoE-1B-7B-0125-Instruct-grpo-E6-D100

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

OLMoE-1B-7B-0125-Instruct-grpo-E6-D100 / README.md

Commit History

End of training

44e74b1
verified

chenggong1995 commited on 11 days ago

Model save

d3a673c
verified

chenggong1995 commited on 11 days ago

End of training

85fc021
verified

chenggong1995 commited on 11 days ago

Model save

ddc44f5
verified

chenggong1995 commited on 11 days ago

Model save

90ce0c0
verified

chenggong1995 commited on 11 days ago