Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions Community

SmolLM2-135M-GRPO-Trained-For-Reasoning / tokenizer.json

Commit History

Upload folder using huggingface_hub

9afa2ee
verified

Macromrit commited on about 23 hours ago