srivatsa92
/

Qwen2.5-3B-Instruct-GSM8K-Reasoning-v1-grpo

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GSM8K-Reasoning-v1-grpo

1 contributor

History: 3 commits

srivatsa

(Trained with Unsloth)

776d38a verified 13 days ago