Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions Community

SmolLM2-135M-GRPO-Trained-For-Reasoning

1 contributor

History: 5 commits

Macromrit's picture

Update README.md

d95fa21 verified about 16 hours ago