philschmid/qwen-2.5-3b-r1-countdown at 0288df2bb763b0131072549214b3854360360fbc

qwen-2.5-3b-r1-countdown

1 contributor

History: 17 commits

philschmid's picture

Training in progress, step 450

0288df2 verified 17 days ago

runs
Training in progress, step 450 17 days ago
.gitattributes

1.57 kB

Training in progress, step 25 17 days ago
added_tokens.json

605 Bytes

Training in progress, step 25 17 days ago
config.json

732 Bytes

Training in progress, step 25 17 days ago
merges.txt

1.67 MB

Training in progress, step 25 17 days ago
model-00001-of-00002.safetensors

4.96 GB
LFS

Training in progress, step 450 17 days ago
model-00002-of-00002.safetensors

1.21 GB
LFS

Training in progress, step 450 17 days ago
model.safetensors.index.json

35.6 kB

Training in progress, step 25 17 days ago
special_tokens_map.json

613 Bytes

Training in progress, step 25 17 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 25 17 days ago
tokenizer_config.json

7.36 kB

Training in progress, step 25 17 days ago
training_args.bin
Detected Pickle imports (14)
- "accelerate.utils.dataclasses.DistributedType",
- "torch.device",
- "torch.bfloat16",
- "transformers.trainer_utils.SaveStrategy",
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.state.PartialState",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig"
How to fix it?
6.84 kB
LFS

Training in progress, step 25 17 days ago
vocab.json

2.78 MB

Training in progress, step 25 17 days ago