Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

SmolLM2-135M-GRPO-Trained-For-Reasoning / generation_config.json

Upload folder using huggingface_hub

9afa2ee verified 1 day ago

132 Bytes