End of training

Browse files

Files changed (4) hide show

all_results.json +8 -0
runs/Dec30_14-15-30_DESKTOP-M04OTBM/events.out.tfevents.1704070519.DESKTOP-M04OTBM.12612.2 +2 -2
test_results.json +8 -0
trainer_state.json +460 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 7.12,
+    "eval_accuracy": 0.8362068965517241,
+    "eval_loss": 0.5077396631240845,
+    "eval_runtime": 328.6662,
+    "eval_samples_per_second": 0.706,
+    "eval_steps_per_second": 0.088
+}

runs/Dec30_14-15-30_DESKTOP-M04OTBM/events.out.tfevents.1704070519.DESKTOP-M04OTBM.12612.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfa4e197c5d7ba0045c05ec5c31a4363c53866338cc3b8bb193f51dbde87482c
-size 411

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a5fadc6f05e21e8e0b396214aab7dce1ee7b214eb0e6a638e4554363f03a0f9
+size 734

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 7.12,
+    "eval_accuracy": 0.8362068965517241,
+    "eval_loss": 0.5077396631240845,
+    "eval_runtime": 328.6662,
+    "eval_samples_per_second": 0.706,
+    "eval_steps_per_second": 0.088
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,460 @@

+{
+  "best_metric": 0.8540772532188842,
+  "best_model_checkpoint": "videomae-base-finetuned-subset\\checkpoint-572",
+  "epoch": 7.118881118881119,
+  "eval_steps": 500,
+  "global_step": 572,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 8.620689655172414e-06,
+      "loss": 1.7046,
+      "step": 10
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.7241379310344828e-05,
+      "loss": 1.6426,
+      "step": 20
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.5862068965517244e-05,
+      "loss": 1.6399,
+      "step": 30
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 3.4482758620689657e-05,
+      "loss": 1.5806,
+      "step": 40
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.3103448275862066e-05,
+      "loss": 1.6143,
+      "step": 50
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.980544747081712e-05,
+      "loss": 1.5891,
+      "step": 60
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.883268482490273e-05,
+      "loss": 1.537,
+      "step": 70
+    },
+    {
+      "epoch": 0.13,
+      "eval_accuracy": 0.36909871244635195,
+      "eval_loss": 1.352622151374817,
+      "eval_runtime": 296.61,
+      "eval_samples_per_second": 0.786,
+      "eval_steps_per_second": 0.101,
+      "step": 72
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 4.7859922178988334e-05,
+      "loss": 1.6023,
+      "step": 80
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 4.688715953307393e-05,
+      "loss": 1.4995,
+      "step": 90
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 4.591439688715953e-05,
+      "loss": 1.3134,
+      "step": 100
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 4.494163424124514e-05,
+      "loss": 1.3048,
+      "step": 110
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 4.396887159533074e-05,
+      "loss": 1.2805,
+      "step": 120
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 4.299610894941635e-05,
+      "loss": 1.3155,
+      "step": 130
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 4.202334630350195e-05,
+      "loss": 1.3677,
+      "step": 140
+    },
+    {
+      "epoch": 1.13,
+      "eval_accuracy": 0.6094420600858369,
+      "eval_loss": 1.0689667463302612,
+      "eval_runtime": 297.3197,
+      "eval_samples_per_second": 0.784,
+      "eval_steps_per_second": 0.101,
+      "step": 144
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 4.105058365758755e-05,
+      "loss": 1.2939,
+      "step": 150
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 4.007782101167315e-05,
+      "loss": 1.1976,
+      "step": 160
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 3.910505836575876e-05,
+      "loss": 1.1674,
+      "step": 170
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 3.813229571984436e-05,
+      "loss": 1.3705,
+      "step": 180
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 3.715953307392996e-05,
+      "loss": 1.1383,
+      "step": 190
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 3.618677042801556e-05,
+      "loss": 1.2091,
+      "step": 200
+    },
+    {
+      "epoch": 2.12,
+      "learning_rate": 3.5214007782101175e-05,
+      "loss": 1.0818,
+      "step": 210
+    },
+    {
+      "epoch": 2.13,
+      "eval_accuracy": 0.8068669527896996,
+      "eval_loss": 0.686530590057373,
+      "eval_runtime": 290.4568,
+      "eval_samples_per_second": 0.802,
+      "eval_steps_per_second": 0.103,
+      "step": 216
+    },
+    {
+      "epoch": 3.01,
+      "learning_rate": 3.4241245136186774e-05,
+      "loss": 1.1519,
+      "step": 220
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 3.326848249027237e-05,
+      "loss": 1.0405,
+      "step": 230
+    },
+    {
+      "epoch": 3.04,
+      "learning_rate": 3.229571984435798e-05,
+      "loss": 1.1704,
+      "step": 240
+    },
+    {
+      "epoch": 3.06,
+      "learning_rate": 3.1322957198443584e-05,
+      "loss": 1.0452,
+      "step": 250
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 3.0350194552529183e-05,
+      "loss": 0.9392,
+      "step": 260
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 2.937743190661479e-05,
+      "loss": 1.0177,
+      "step": 270
+    },
+    {
+      "epoch": 3.11,
+      "learning_rate": 2.8404669260700388e-05,
+      "loss": 1.1608,
+      "step": 280
+    },
+    {
+      "epoch": 3.13,
+      "eval_accuracy": 0.7682403433476395,
+      "eval_loss": 0.6641637682914734,
+      "eval_runtime": 295.5507,
+      "eval_samples_per_second": 0.788,
+      "eval_steps_per_second": 0.102,
+      "step": 288
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 2.7431906614785997e-05,
+      "loss": 0.8705,
+      "step": 290
+    },
+    {
+      "epoch": 4.02,
+      "learning_rate": 2.6459143968871596e-05,
+      "loss": 0.9477,
+      "step": 300
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 2.54863813229572e-05,
+      "loss": 1.1204,
+      "step": 310
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 2.45136186770428e-05,
+      "loss": 1.1114,
+      "step": 320
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 2.3540856031128406e-05,
+      "loss": 0.9802,
+      "step": 330
+    },
+    {
+      "epoch": 4.09,
+      "learning_rate": 2.256809338521401e-05,
+      "loss": 0.9903,
+      "step": 340
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 2.1595330739299615e-05,
+      "loss": 0.9075,
+      "step": 350
+    },
+    {
+      "epoch": 4.13,
+      "learning_rate": 2.0622568093385214e-05,
+      "loss": 0.9544,
+      "step": 360
+    },
+    {
+      "epoch": 4.13,
+      "eval_accuracy": 0.7510729613733905,
+      "eval_loss": 0.6866205930709839,
+      "eval_runtime": 295.4237,
+      "eval_samples_per_second": 0.789,
+      "eval_steps_per_second": 0.102,
+      "step": 360
+    },
+    {
+      "epoch": 5.02,
+      "learning_rate": 1.964980544747082e-05,
+      "loss": 0.823,
+      "step": 370
+    },
+    {
+      "epoch": 5.03,
+      "learning_rate": 1.867704280155642e-05,
+      "loss": 0.8399,
+      "step": 380
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 1.7704280155642024e-05,
+      "loss": 0.905,
+      "step": 390
+    },
+    {
+      "epoch": 5.07,
+      "learning_rate": 1.6731517509727626e-05,
+      "loss": 1.0257,
+      "step": 400
+    },
+    {
+      "epoch": 5.09,
+      "learning_rate": 1.575875486381323e-05,
+      "loss": 0.8594,
+      "step": 410
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 1.4785992217898833e-05,
+      "loss": 1.0511,
+      "step": 420
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 1.3813229571984437e-05,
+      "loss": 0.896,
+      "step": 430
+    },
+    {
+      "epoch": 5.13,
+      "eval_accuracy": 0.8111587982832618,
+      "eval_loss": 0.5386895537376404,
+      "eval_runtime": 307.3722,
+      "eval_samples_per_second": 0.758,
+      "eval_steps_per_second": 0.098,
+      "step": 432
+    },
+    {
+      "epoch": 6.01,
+      "learning_rate": 1.2840466926070038e-05,
+      "loss": 1.0749,
+      "step": 440
+    },
+    {
+      "epoch": 6.03,
+      "learning_rate": 1.1867704280155642e-05,
+      "loss": 0.7563,
+      "step": 450
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 1.0894941634241246e-05,
+      "loss": 0.7283,
+      "step": 460
+    },
+    {
+      "epoch": 6.07,
+      "learning_rate": 9.922178988326848e-06,
+      "loss": 0.828,
+      "step": 470
+    },
+    {
+      "epoch": 6.08,
+      "learning_rate": 8.949416342412452e-06,
+      "loss": 0.7049,
+      "step": 480
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 7.976653696498054e-06,
+      "loss": 0.8519,
+      "step": 490
+    },
+    {
+      "epoch": 6.12,
+      "learning_rate": 7.003891050583658e-06,
+      "loss": 0.9193,
+      "step": 500
+    },
+    {
+      "epoch": 6.13,
+      "eval_accuracy": 0.7896995708154506,
+      "eval_loss": 0.5693105459213257,
+      "eval_runtime": 309.0046,
+      "eval_samples_per_second": 0.754,
+      "eval_steps_per_second": 0.097,
+      "step": 504
+    },
+    {
+      "epoch": 7.01,
+      "learning_rate": 6.031128404669261e-06,
+      "loss": 0.6539,
+      "step": 510
+    },
+    {
+      "epoch": 7.03,
+      "learning_rate": 5.058365758754864e-06,
+      "loss": 0.938,
+      "step": 520
+    },
+    {
+      "epoch": 7.05,
+      "learning_rate": 4.085603112840467e-06,
+      "loss": 0.7144,
+      "step": 530
+    },
+    {
+      "epoch": 7.06,
+      "learning_rate": 3.11284046692607e-06,
+      "loss": 0.6887,
+      "step": 540
+    },
+    {
+      "epoch": 7.08,
+      "learning_rate": 2.1400778210116734e-06,
+      "loss": 0.783,
+      "step": 550
+    },
+    {
+      "epoch": 7.1,
+      "learning_rate": 1.1673151750972764e-06,
+      "loss": 0.7003,
+      "step": 560
+    },
+    {
+      "epoch": 7.12,
+      "learning_rate": 1.9455252918287938e-07,
+      "loss": 0.6941,
+      "step": 570
+    },
+    {
+      "epoch": 7.12,
+      "eval_accuracy": 0.8540772532188842,
+      "eval_loss": 0.4813331663608551,
+      "eval_runtime": 347.0424,
+      "eval_samples_per_second": 0.671,
+      "eval_steps_per_second": 0.086,
+      "step": 572
+    },
+    {
+      "epoch": 7.12,
+      "step": 572,
+      "total_flos": 5.66725337294635e+18,
+      "train_loss": 1.092671564825765,
+      "train_runtime": 9246.047,
+      "train_samples_per_second": 0.495,
+      "train_steps_per_second": 0.062
+    },
+    {
+      "epoch": 7.12,
+      "eval_accuracy": 0.8362068965517241,
+      "eval_loss": 0.507739782333374,
+      "eval_runtime": 327.0584,
+      "eval_samples_per_second": 0.709,
+      "eval_steps_per_second": 0.089,
+      "step": 572
+    },
+    {
+      "epoch": 7.12,
+      "eval_accuracy": 0.8362068965517241,
+      "eval_loss": 0.5077396631240845,
+      "eval_runtime": 328.6662,
+      "eval_samples_per_second": 0.706,
+      "eval_steps_per_second": 0.088,
+      "step": 572
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 572,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "total_flos": 5.66725337294635e+18,
+  "trial_name": null,
+  "trial_params": null
+}