vit-base-patch16-224-blur_vs_clean / trainer_state.json

Duplicate from mansee/vit-base-patch16-224-blur_vs_clean

b779f11 about 1 year ago

6.82 kB

	{
	"best_metric": 0.9753602975360297,
	"best_model_checkpoint": "vit-base-patch16-224-blur_vs_clean/checkpoint-453",
	"epoch": 2.9950413223140497,
	"global_step": 453,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.07,
	"learning_rate": 1.0869565217391305e-05,
	"loss": 0.7653,
	"step": 10
	},
	{
	"epoch": 0.13,
	"learning_rate": 2.173913043478261e-05,
	"loss": 0.6297,
	"step": 20
	},
	{
	"epoch": 0.2,
	"learning_rate": 3.260869565217392e-05,
	"loss": 0.4462,
	"step": 30
	},
	{
	"epoch": 0.26,
	"learning_rate": 4.347826086956522e-05,
	"loss": 0.2414,
	"step": 40
	},
	{
	"epoch": 0.33,
	"learning_rate": 4.950859950859951e-05,
	"loss": 0.1249,
	"step": 50
	},
	{
	"epoch": 0.4,
	"learning_rate": 4.8280098280098285e-05,
	"loss": 0.1293,
	"step": 60
	},
	{
	"epoch": 0.46,
	"learning_rate": 4.705159705159705e-05,
	"loss": 0.1083,
	"step": 70
	},
	{
	"epoch": 0.53,
	"learning_rate": 4.582309582309582e-05,
	"loss": 0.0917,
	"step": 80
	},
	{
	"epoch": 0.6,
	"learning_rate": 4.4594594594594596e-05,
	"loss": 0.1057,
	"step": 90
	},
	{
	"epoch": 0.66,
	"learning_rate": 4.336609336609337e-05,
	"loss": 0.0803,
	"step": 100
	},
	{
	"epoch": 0.73,
	"learning_rate": 4.213759213759214e-05,
	"loss": 0.0666,
	"step": 110
	},
	{
	"epoch": 0.79,
	"learning_rate": 4.0909090909090915e-05,
	"loss": 0.0832,
	"step": 120
	},
	{
	"epoch": 0.86,
	"learning_rate": 3.968058968058968e-05,
	"loss": 0.0867,
	"step": 130
	},
	{
	"epoch": 0.93,
	"learning_rate": 3.845208845208845e-05,
	"loss": 0.0812,
	"step": 140
	},
	{
	"epoch": 0.99,
	"learning_rate": 3.7223587223587226e-05,
	"loss": 0.0539,
	"step": 150
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.9595536959553695,
	"eval_loss": 0.10777629911899567,
	"eval_runtime": 34.5907,
	"eval_samples_per_second": 62.184,
	"eval_steps_per_second": 1.966,
	"step": 151
	},
	{
	"epoch": 1.06,
	"learning_rate": 3.5995085995085995e-05,
	"loss": 0.0753,
	"step": 160
	},
	{
	"epoch": 1.12,
	"learning_rate": 3.476658476658477e-05,
	"loss": 0.0619,
	"step": 170
	},
	{
	"epoch": 1.19,
	"learning_rate": 3.3538083538083545e-05,
	"loss": 0.0605,
	"step": 180
	},
	{
	"epoch": 1.26,
	"learning_rate": 3.2309582309582306e-05,
	"loss": 0.0473,
	"step": 190
	},
	{
	"epoch": 1.32,
	"learning_rate": 3.108108108108108e-05,
	"loss": 0.0672,
	"step": 200
	},
	{
	"epoch": 1.39,
	"learning_rate": 2.9852579852579853e-05,
	"loss": 0.0626,
	"step": 210
	},
	{
	"epoch": 1.45,
	"learning_rate": 2.8624078624078625e-05,
	"loss": 0.0704,
	"step": 220
	},
	{
	"epoch": 1.52,
	"learning_rate": 2.73955773955774e-05,
	"loss": 0.0517,
	"step": 230
	},
	{
	"epoch": 1.59,
	"learning_rate": 2.616707616707617e-05,
	"loss": 0.0494,
	"step": 240
	},
	{
	"epoch": 1.65,
	"learning_rate": 2.493857493857494e-05,
	"loss": 0.0603,
	"step": 250
	},
	{
	"epoch": 1.72,
	"learning_rate": 2.371007371007371e-05,
	"loss": 0.0678,
	"step": 260
	},
	{
	"epoch": 1.79,
	"learning_rate": 2.2481572481572483e-05,
	"loss": 0.0506,
	"step": 270
	},
	{
	"epoch": 1.85,
	"learning_rate": 2.1253071253071255e-05,
	"loss": 0.0556,
	"step": 280
	},
	{
	"epoch": 1.92,
	"learning_rate": 2.0024570024570026e-05,
	"loss": 0.0687,
	"step": 290
	},
	{
	"epoch": 1.98,
	"learning_rate": 1.8796068796068798e-05,
	"loss": 0.0611,
	"step": 300
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.9697814969781497,
	"eval_loss": 0.08457668125629425,
	"eval_runtime": 33.7533,
	"eval_samples_per_second": 63.727,
	"eval_steps_per_second": 2.015,
	"step": 302
	},
	{
	"epoch": 2.05,
	"learning_rate": 1.756756756756757e-05,
	"loss": 0.0444,
	"step": 310
	},
	{
	"epoch": 2.12,
	"learning_rate": 1.6339066339066338e-05,
	"loss": 0.0417,
	"step": 320
	},
	{
	"epoch": 2.18,
	"learning_rate": 1.5110565110565111e-05,
	"loss": 0.0496,
	"step": 330
	},
	{
	"epoch": 2.25,
	"learning_rate": 1.3882063882063885e-05,
	"loss": 0.045,
	"step": 340
	},
	{
	"epoch": 2.31,
	"learning_rate": 1.2653562653562653e-05,
	"loss": 0.0496,
	"step": 350
	},
	{
	"epoch": 2.38,
	"learning_rate": 1.1425061425061426e-05,
	"loss": 0.0481,
	"step": 360
	},
	{
	"epoch": 2.45,
	"learning_rate": 1.0196560196560196e-05,
	"loss": 0.0329,
	"step": 370
	},
	{
	"epoch": 2.51,
	"learning_rate": 8.96805896805897e-06,
	"loss": 0.0424,
	"step": 380
	},
	{
	"epoch": 2.58,
	"learning_rate": 7.73955773955774e-06,
	"loss": 0.0274,
	"step": 390
	},
	{
	"epoch": 2.64,
	"learning_rate": 6.511056511056511e-06,
	"loss": 0.0394,
	"step": 400
	},
	{
	"epoch": 2.71,
	"learning_rate": 5.282555282555283e-06,
	"loss": 0.0522,
	"step": 410
	},
	{
	"epoch": 2.78,
	"learning_rate": 4.0540540540540545e-06,
	"loss": 0.0331,
	"step": 420
	},
	{
	"epoch": 2.84,
	"learning_rate": 2.8255528255528258e-06,
	"loss": 0.0275,
	"step": 430
	},
	{
	"epoch": 2.91,
	"learning_rate": 1.5970515970515972e-06,
	"loss": 0.0374,
	"step": 440
	},
	{
	"epoch": 2.98,
	"learning_rate": 3.6855036855036856e-07,
	"loss": 0.049,
	"step": 450
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.9753602975360297,
	"eval_loss": 0.07140230387449265,
	"eval_runtime": 35.4449,
	"eval_samples_per_second": 60.686,
	"eval_steps_per_second": 1.918,
	"step": 453
	},
	{
	"epoch": 3.0,
	"step": 453,
	"total_flos": 4.4917456860202107e+18,
	"train_loss": 0.10242866058618028,
	"train_runtime": 2277.1585,
	"train_samples_per_second": 25.492,
	"train_steps_per_second": 0.199
	}
	],
	"max_steps": 453,
	"num_train_epochs": 3,
	"total_flos": 4.4917456860202107e+18,
	"trial_name": null,
	"trial_params": null
	}