morizon
/

llm-jp-3-13b-instruct2-grpo-MATH-lighteval_step1000_lora

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-MATH-lighteval_step1000_lora

Commit History

Trained with Unsloth

88cd2a8
verified

morizon commited on 19 days ago

Trained with Unsloth

84f1f1b
verified

morizon commited on 19 days ago

Upload README.md with huggingface_hub

26c8a0b
verified

morizon commited on 19 days ago

initial commit

9b8131b
verified

morizon commited on 19 days ago