srivatsa92
/

Qwen2.5-3B-Instruct-GSM8K-Reasoning-v1-grpo

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GSM8K-Reasoning-v1-grpo / model-00002-of-00002.safetensors

Commit History

(Trained with Unsloth)

776d38a
verified

srivatsa commited on 13 days ago