{"train/loss": 4.5462, "train/grad_norm": 58.19491958618164, "train/learning_rate": 1.6666666666666667e-06, "train/epoch": 0.0, "train/global_step": 20, "_timestamp": 1712923227.6021373, "_runtime": 36.01116728782654, "_step": 0}