sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO / tokenizer.json

Commit History

Training in progress, step 10

a7bd6e4
verified

sergiopaniego commited on 21 days ago