|
{ |
|
"best_metric": 0.2632964849472046, |
|
"best_model_checkpoint": "autotrain-Chiara2/checkpoint-18", |
|
"epoch": 2.0, |
|
"eval_steps": 500, |
|
"global_step": 18, |
|
"is_hyper_param_search": false, |
|
"is_local_process_zero": true, |
|
"is_world_process_zero": true, |
|
"log_history": [ |
|
{ |
|
"epoch": 0.1111111111111111, |
|
"grad_norm": 364.52386474609375, |
|
"learning_rate": 0.00016666666666666666, |
|
"loss": 6.9638, |
|
"step": 1 |
|
}, |
|
{ |
|
"epoch": 0.2222222222222222, |
|
"grad_norm": 246.92811584472656, |
|
"learning_rate": 0.0003333333333333333, |
|
"loss": 4.562, |
|
"step": 2 |
|
}, |
|
{ |
|
"epoch": 0.3333333333333333, |
|
"grad_norm": 59.629798889160156, |
|
"learning_rate": 0.0005, |
|
"loss": 2.5174, |
|
"step": 3 |
|
}, |
|
{ |
|
"epoch": 0.4444444444444444, |
|
"grad_norm": 20.26913070678711, |
|
"learning_rate": 0.0004791666666666667, |
|
"loss": 0.8195, |
|
"step": 4 |
|
}, |
|
{ |
|
"epoch": 0.5555555555555556, |
|
"grad_norm": 14.140233993530273, |
|
"learning_rate": 0.0004583333333333333, |
|
"loss": 1.2522, |
|
"step": 5 |
|
}, |
|
{ |
|
"epoch": 0.6666666666666666, |
|
"grad_norm": 14.12821102142334, |
|
"learning_rate": 0.0004375, |
|
"loss": 1.3973, |
|
"step": 6 |
|
}, |
|
{ |
|
"epoch": 0.7777777777777778, |
|
"grad_norm": 10.597712516784668, |
|
"learning_rate": 0.0004166666666666667, |
|
"loss": 1.1615, |
|
"step": 7 |
|
}, |
|
{ |
|
"epoch": 0.8888888888888888, |
|
"grad_norm": 1.9146018028259277, |
|
"learning_rate": 0.0003958333333333333, |
|
"loss": 0.6808, |
|
"step": 8 |
|
}, |
|
{ |
|
"epoch": 1.0, |
|
"grad_norm": 0.8343021273612976, |
|
"learning_rate": 0.000375, |
|
"loss": 0.6365, |
|
"step": 9 |
|
}, |
|
{ |
|
"epoch": 1.0, |
|
"eval_accuracy": 0.5, |
|
"eval_auc": 0.9822222222222223, |
|
"eval_f1": 0.6666666666666666, |
|
"eval_loss": 0.7654130458831787, |
|
"eval_precision": 0.5, |
|
"eval_recall": 1.0, |
|
"eval_runtime": 11.1692, |
|
"eval_samples_per_second": 2.686, |
|
"eval_steps_per_second": 0.179, |
|
"step": 9 |
|
}, |
|
{ |
|
"epoch": 1.1111111111111112, |
|
"grad_norm": 2.730844020843506, |
|
"learning_rate": 0.0003541666666666667, |
|
"loss": 0.7581, |
|
"step": 10 |
|
}, |
|
{ |
|
"epoch": 1.2222222222222223, |
|
"grad_norm": 3.2819716930389404, |
|
"learning_rate": 0.0003333333333333333, |
|
"loss": 0.6775, |
|
"step": 11 |
|
}, |
|
{ |
|
"epoch": 1.3333333333333333, |
|
"grad_norm": 1.4362558126449585, |
|
"learning_rate": 0.0003125, |
|
"loss": 0.65, |
|
"step": 12 |
|
}, |
|
{ |
|
"epoch": 1.4444444444444444, |
|
"grad_norm": 2.433623790740967, |
|
"learning_rate": 0.0002916666666666667, |
|
"loss": 0.6205, |
|
"step": 13 |
|
}, |
|
{ |
|
"epoch": 1.5555555555555556, |
|
"grad_norm": 2.65726637840271, |
|
"learning_rate": 0.0002708333333333333, |
|
"loss": 0.6386, |
|
"step": 14 |
|
}, |
|
{ |
|
"epoch": 1.6666666666666665, |
|
"grad_norm": 5.401534557342529, |
|
"learning_rate": 0.00025, |
|
"loss": 0.7259, |
|
"step": 15 |
|
}, |
|
{ |
|
"epoch": 1.7777777777777777, |
|
"grad_norm": 2.8221542835235596, |
|
"learning_rate": 0.00022916666666666666, |
|
"loss": 0.4751, |
|
"step": 16 |
|
}, |
|
{ |
|
"epoch": 1.8888888888888888, |
|
"grad_norm": 4.188050270080566, |
|
"learning_rate": 0.00020833333333333335, |
|
"loss": 0.7153, |
|
"step": 17 |
|
}, |
|
{ |
|
"epoch": 2.0, |
|
"grad_norm": 6.374919891357422, |
|
"learning_rate": 0.0001875, |
|
"loss": 0.5568, |
|
"step": 18 |
|
}, |
|
{ |
|
"epoch": 2.0, |
|
"eval_accuracy": 0.9666666666666667, |
|
"eval_auc": 0.9866666666666667, |
|
"eval_f1": 0.9655172413793104, |
|
"eval_loss": 0.2632964849472046, |
|
"eval_precision": 1.0, |
|
"eval_recall": 0.9333333333333333, |
|
"eval_runtime": 10.6144, |
|
"eval_samples_per_second": 2.826, |
|
"eval_steps_per_second": 0.188, |
|
"step": 18 |
|
} |
|
], |
|
"logging_steps": 1, |
|
"max_steps": 27, |
|
"num_input_tokens_seen": 0, |
|
"num_train_epochs": 3, |
|
"save_steps": 500, |
|
"stateful_callbacks": { |
|
"EarlyStoppingCallback": { |
|
"args": { |
|
"early_stopping_patience": 5, |
|
"early_stopping_threshold": 0.01 |
|
}, |
|
"attributes": { |
|
"early_stopping_patience_counter": 0 |
|
} |
|
}, |
|
"TrainerControl": { |
|
"args": { |
|
"should_epoch_stop": false, |
|
"should_evaluate": false, |
|
"should_log": false, |
|
"should_save": true, |
|
"should_training_stop": false |
|
}, |
|
"attributes": {} |
|
} |
|
}, |
|
"total_flos": 1.096837778792448e+16, |
|
"train_batch_size": 8, |
|
"trial_name": null, |
|
"trial_params": null |
|
} |
|
|