longlian
/

Qwen2-1.5B-GRPO-demo

Model card Files Files and versions Community

Qwen2-1.5B-GRPO-demo

1 contributor

History: 12 commits

longlian's picture

Training in progress, step 110

3ba2071 verified 23 days ago

.gitattributes

1.57 kB

Training in progress, step 10 23 days ago
added_tokens.json

80 Bytes

Training in progress, step 10 23 days ago
config.json

735 Bytes

Training in progress, step 10 23 days ago
merges.txt

1.67 MB

Training in progress, step 10 23 days ago
model.safetensors

3.09 GB
LFS

Training in progress, step 110 23 days ago
special_tokens_map.json

367 Bytes

Training in progress, step 10 23 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 10 23 days ago
tokenizer_config.json

1.36 kB

Training in progress, step 10 23 days ago
training_args.bin
Detected Pickle imports (10)
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.SchedulerType",
- "transformers.training_args.OptimizerNames",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
5.75 kB
LFS

Training in progress, step 10 23 days ago
vocab.json

2.78 MB

Training in progress, step 10 23 days ago