{"train/loss": 3.6056, "train/grad_norm": 1.908144235610962, "train/learning_rate": 3.2500000000000002e-06, "train/epoch": 0.0, "train/global_step": 40, "_timestamp": 1712984842.1107213, "_runtime": 32.22792339324951, "_step": 1}