Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions Community

SmolLM2-135M-GRPO-Trained-For-Reasoning / README.md

Commit History

Update README.md

d95fa21
verified

Macromrit commited on about 23 hours ago

Update README.md

4682436
verified

Macromrit commited on about 24 hours ago

initial commit

3e3a6a9
verified

Macromrit commited on about 24 hours ago