Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions Community

SmolLM2-135M-GRPO-Trained-For-Reasoning

Commit History

Upload GRPO.png

b8a2908
verified

Macromrit commited on 1 day ago

Update README.md

4682436
verified

Macromrit commited on 1 day ago

Upload folder using huggingface_hub

9afa2ee
verified

Macromrit commited on 1 day ago

initial commit

3e3a6a9
verified

Macromrit commited on 1 day ago