{"train/loss": 3.594, "train/grad_norm": 75.66071319580078, "train/learning_rate": 1.5333333333333334e-05, "train/epoch": 0.0, "train/global_step": 100, "_timestamp": 1713080002.8489428, "_runtime": 125.40971970558167, "_step": 4}