swin-tiny-patch4-window7-224 / trainer_state.json
HorcruxNo13's picture
Training in progress, epoch 1
a6553e0
raw
history blame
4.23 kB
{
"best_metric": 0.7416666666666667,
"best_model_checkpoint": "swin-tiny-patch4-window7-224/checkpoint-48",
"epoch": 7.0,
"eval_steps": 500,
"global_step": 56,
"is_hyper_param_search": false,
"is_local_process_zero": true,
"is_world_process_zero": true,
"log_history": [
{
"epoch": 1.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5834997296333313,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 33.1193,
"eval_samples_per_second": 7.247,
"eval_steps_per_second": 0.242,
"step": 8
},
{
"epoch": 1.25,
"learning_rate": 4.600000000000001e-05,
"loss": 0.6395,
"step": 10
},
{
"epoch": 2.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5735692381858826,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 2.0727,
"eval_samples_per_second": 115.793,
"eval_steps_per_second": 3.86,
"step": 16
},
{
"epoch": 2.5,
"learning_rate": 3.6e-05,
"loss": 0.5789,
"step": 20
},
{
"epoch": 3.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5942796468734741,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 2.0683,
"eval_samples_per_second": 116.035,
"eval_steps_per_second": 3.868,
"step": 24
},
{
"epoch": 3.75,
"learning_rate": 2.6000000000000002e-05,
"loss": 0.5887,
"step": 30
},
{
"epoch": 4.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5613328218460083,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 2.0585,
"eval_samples_per_second": 116.592,
"eval_steps_per_second": 3.886,
"step": 32
},
{
"epoch": 5.0,
"learning_rate": 1.6000000000000003e-05,
"loss": 0.5791,
"step": 40
},
{
"epoch": 5.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5557453036308289,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 2.0897,
"eval_samples_per_second": 114.847,
"eval_steps_per_second": 3.828,
"step": 40
},
{
"epoch": 6.0,
"eval_accuracy": 0.7416666666666667,
"eval_f1_score": 0.6396720831503441,
"eval_loss": 0.5535091161727905,
"eval_precision": 0.8089635854341737,
"eval_recall": 0.7416666666666667,
"eval_runtime": 1.9813,
"eval_samples_per_second": 121.134,
"eval_steps_per_second": 4.038,
"step": 48
},
{
"epoch": 6.25,
"learning_rate": 6e-06,
"loss": 0.5717,
"step": 50
},
{
"epoch": 7.0,
"eval_accuracy": 0.7333333333333333,
"eval_f1_score": 0.6205128205128204,
"eval_loss": 0.5456091165542603,
"eval_precision": 0.5377777777777778,
"eval_recall": 0.7333333333333333,
"eval_runtime": 2.0655,
"eval_samples_per_second": 116.197,
"eval_steps_per_second": 3.873,
"step": 56
},
{
"epoch": 7.0,
"step": 56,
"total_flos": 1.73991922900992e+17,
"train_loss": 0.5857737362384796,
"train_runtime": 257.742,
"train_samples_per_second": 27.159,
"train_steps_per_second": 0.217
},
{
"epoch": 7.0,
"eval_accuracy": 0.7366666666666667,
"eval_f1_score": 0.6314646594113398,
"eval_loss": 0.5486770868301392,
"eval_precision": 0.8064765100671142,
"eval_recall": 0.7366666666666667,
"eval_runtime": 109.0657,
"eval_samples_per_second": 2.751,
"eval_steps_per_second": 0.092,
"step": 56
}
],
"logging_steps": 10,
"max_steps": 56,
"num_train_epochs": 7,
"save_steps": 500,
"total_flos": 1.73991922900992e+17,
"trial_name": null,
"trial_params": null
}