Training in progress, step 28

Files changed (6) hide show

adapter_config.json CHANGED Viewed

@@ -23,21 +23,21 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "lm_heads.2",
-    "lm_heads.3",
     "v_proj",
-    "embed_tokens.3",
     "embed_tokens.1",
-    "lm_heads.1",
-    "lm_heads.0",
-    "out_proj",
     "q_proj",
-    "fc2",
     "enc_to_dec_proj",
     "k_proj",
-    "embed_tokens.0",
-    "embed_tokens.2",
-    "audio_enc_to_dec_proj",
     "fc1"
   ],
   "task_type": null,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "embed_tokens.2",
     "v_proj",
+    "fc2",
+    "audio_enc_to_dec_proj",
+    "embed_tokens.0",
     "embed_tokens.1",
     "q_proj",
     "enc_to_dec_proj",
+    "embed_tokens.3",
+    "lm_heads.3",
+    "lm_heads.1",
+    "out_proj",
+    "lm_heads.2",
+    "lm_heads.0",
     "k_proj",
     "fc1"
   ],
   "task_type": null,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3ee6f0a532947f286fd10028d7b5ed05cf7581dfdda47040cf5d3989f8da173
 size 43594480

 version https://git-lfs.github.com/spec/v1
+oid sha256:1fbc9a7cc45bc2049c0744d1dcb44a4e7fc11b71163218cca0038a5ccf48394b
 size 43594480

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.764705882352941,
-    "train_loss": 9.197729110717773,
-    "train_runtime": 36.8812,
     "train_samples": 33,
-    "train_samples_per_second": 3.579,
-    "train_steps_per_second": 0.217
 }

 {
     "epoch": 3.764705882352941,
+    "train_loss": 9.197454690933228,
+    "train_runtime": 36.5767,
     "train_samples": 33,
+    "train_samples_per_second": 3.609,
+    "train_steps_per_second": 0.219
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 3.764705882352941,
-    "train_loss": 9.197729110717773,
-    "train_runtime": 36.8812,
     "train_samples": 33,
-    "train_samples_per_second": 3.579,
-    "train_steps_per_second": 0.217
 }

 {
     "epoch": 3.764705882352941,
+    "train_loss": 9.197454690933228,
+    "train_runtime": 36.5767,
     "train_samples": 33,
+    "train_samples_per_second": 3.609,
+    "train_steps_per_second": 0.219
 }

trainer_state.json CHANGED Viewed

@@ -10,40 +10,40 @@
   "log_history": [
     {
       "epoch": 0.9411764705882353,
-      "grad_norm": 0.8986203670501709,
       "learning_rate": 0.00015000000000000001,
-      "loss": 9.5251,
       "step": 2
     },
     {
       "epoch": 1.8823529411764706,
-      "grad_norm": 1.1994189023971558,
       "learning_rate": 0.0001,
-      "loss": 9.292,
       "step": 4
     },
     {
       "epoch": 2.8235294117647056,
-      "grad_norm": 1.3807952404022217,
       "learning_rate": 5e-05,
-      "loss": 9.0613,
       "step": 6
     },
     {
       "epoch": 3.764705882352941,
-      "grad_norm": 1.505556583404541,
       "learning_rate": 0.0,
-      "loss": 8.9125,
       "step": 8
     },
     {
       "epoch": 3.764705882352941,
       "step": 8,
       "total_flos": 36858669560664.0,
-      "train_loss": 9.197729110717773,
-      "train_runtime": 36.8812,
-      "train_samples_per_second": 3.579,
-      "train_steps_per_second": 0.217
     }
   ],
   "logging_steps": 2,

   "log_history": [
     {
       "epoch": 0.9411764705882353,
+      "grad_norm": 0.858464241027832,
       "learning_rate": 0.00015000000000000001,
+      "loss": 9.5253,
       "step": 2
     },
     {
       "epoch": 1.8823529411764706,
+      "grad_norm": 1.1875278949737549,
       "learning_rate": 0.0001,
+      "loss": 9.2917,
       "step": 4
     },
     {
       "epoch": 2.8235294117647056,
+      "grad_norm": 1.371861219406128,
       "learning_rate": 5e-05,
+      "loss": 9.0606,
       "step": 6
     },
     {
       "epoch": 3.764705882352941,
+      "grad_norm": 1.4962043762207031,
       "learning_rate": 0.0,
+      "loss": 8.9123,
       "step": 8
     },
     {
       "epoch": 3.764705882352941,
       "step": 8,
       "total_flos": 36858669560664.0,
+      "train_loss": 9.197454690933228,
+      "train_runtime": 36.5767,
+      "train_samples_per_second": 3.609,
+      "train_steps_per_second": 0.219
     }
   ],
   "logging_steps": 2,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3345c3f211bd0d480043830ef6fda7b32c9e127c3cb703d215ec2ad31ebb6527
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:dda95e344fbc5fafe01ef7ae8bb96b4c7f86267c4bb377a7ff668174d581b215
 size 5304