Training in progress, epoch 2

Browse files

Files changed (5) hide show

model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
trainer_log.jsonl +43 -0

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:36d2fa8441f3eb74637a440fe06e3261c73ff303c88950c1c032f9ce3fde70f3
 size 4976698672

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b9de2a6033f253181dfc5839a3975f46c30ab6314e2b749e62ddadf701daa72
 size 4976698672

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dedf7539058775d6a6e2283d886022794c235971fd7be9997d9875fa8e948f12
 size 4999802720

 version https://git-lfs.github.com/spec/v1
+oid sha256:9da0f6bc1e5a6188ed9e32371afa146a8b0145e6001cd45099d9f1a852bb008a
 size 4999802720

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4812801af19674d26672c97c9e3eeb17d65c95934dc2a190adbcfcd7500caf54
 size 4915916176

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a5636996dfdb10b6901afb8ba17208ac60274d6efa2ddcd253c5412363f570d
 size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68086ff9196e6439027ca69140facaf3593e0f13b1f37468110a55c0b8a63f8f
 size 1168138808

 version https://git-lfs.github.com/spec/v1
+oid sha256:2eb5a25fde479d1dc1fff7586952af9caf53bc8d93e657d9813dd2838bf64122
 size 1168138808

trainer_log.jsonl CHANGED Viewed

@@ -44,3 +44,46 @@
 {"current_steps": 430, "total_steps": 1269, "loss": 0.8787, "learning_rate": 5e-06, "epoch": 1.016548463356974, "percentage": 33.88, "elapsed_time": "0:49:23", "remaining_time": "1:36:23"}
 {"current_steps": 440, "total_steps": 1269, "loss": 0.8696, "learning_rate": 5e-06, "epoch": 1.0401891252955082, "percentage": 34.67, "elapsed_time": "0:50:29", "remaining_time": "1:35:07"}
 {"current_steps": 450, "total_steps": 1269, "loss": 0.8629, "learning_rate": 5e-06, "epoch": 1.0638297872340425, "percentage": 35.46, "elapsed_time": "0:51:41", "remaining_time": "1:34:04"}

 {"current_steps": 430, "total_steps": 1269, "loss": 0.8787, "learning_rate": 5e-06, "epoch": 1.016548463356974, "percentage": 33.88, "elapsed_time": "0:49:23", "remaining_time": "1:36:23"}
 {"current_steps": 440, "total_steps": 1269, "loss": 0.8696, "learning_rate": 5e-06, "epoch": 1.0401891252955082, "percentage": 34.67, "elapsed_time": "0:50:29", "remaining_time": "1:35:07"}
 {"current_steps": 450, "total_steps": 1269, "loss": 0.8629, "learning_rate": 5e-06, "epoch": 1.0638297872340425, "percentage": 35.46, "elapsed_time": "0:51:41", "remaining_time": "1:34:04"}
+{"current_steps": 460, "total_steps": 1269, "loss": 0.8631, "learning_rate": 5e-06, "epoch": 1.0874704491725768, "percentage": 36.25, "elapsed_time": "0:52:48", "remaining_time": "1:32:52"}
+{"current_steps": 470, "total_steps": 1269, "loss": 0.865, "learning_rate": 5e-06, "epoch": 1.1111111111111112, "percentage": 37.04, "elapsed_time": "0:53:50", "remaining_time": "1:31:32"}
+{"current_steps": 480, "total_steps": 1269, "loss": 0.8588, "learning_rate": 5e-06, "epoch": 1.1347517730496455, "percentage": 37.83, "elapsed_time": "0:54:53", "remaining_time": "1:30:13"}
+{"current_steps": 490, "total_steps": 1269, "loss": 0.8605, "learning_rate": 5e-06, "epoch": 1.1583924349881798, "percentage": 38.61, "elapsed_time": "0:55:55", "remaining_time": "1:28:54"}
+{"current_steps": 500, "total_steps": 1269, "loss": 0.865, "learning_rate": 5e-06, "epoch": 1.1820330969267139, "percentage": 39.4, "elapsed_time": "0:56:57", "remaining_time": "1:27:36"}
+{"current_steps": 510, "total_steps": 1269, "loss": 0.866, "learning_rate": 5e-06, "epoch": 1.2056737588652482, "percentage": 40.19, "elapsed_time": "0:58:01", "remaining_time": "1:26:21"}
+{"current_steps": 520, "total_steps": 1269, "loss": 0.8652, "learning_rate": 5e-06, "epoch": 1.2293144208037825, "percentage": 40.98, "elapsed_time": "0:59:06", "remaining_time": "1:25:08"}
+{"current_steps": 530, "total_steps": 1269, "loss": 0.8653, "learning_rate": 5e-06, "epoch": 1.2529550827423168, "percentage": 41.77, "elapsed_time": "1:00:08", "remaining_time": "1:23:51"}
+{"current_steps": 540, "total_steps": 1269, "loss": 0.859, "learning_rate": 5e-06, "epoch": 1.2765957446808511, "percentage": 42.55, "elapsed_time": "1:01:11", "remaining_time": "1:22:35"}
+{"current_steps": 550, "total_steps": 1269, "loss": 0.8639, "learning_rate": 5e-06, "epoch": 1.3002364066193852, "percentage": 43.34, "elapsed_time": "1:02:13", "remaining_time": "1:21:20"}
+{"current_steps": 560, "total_steps": 1269, "loss": 0.8678, "learning_rate": 5e-06, "epoch": 1.3238770685579198, "percentage": 44.13, "elapsed_time": "1:03:15", "remaining_time": "1:20:05"}
+{"current_steps": 570, "total_steps": 1269, "loss": 0.863, "learning_rate": 5e-06, "epoch": 1.3475177304964538, "percentage": 44.92, "elapsed_time": "1:04:17", "remaining_time": "1:18:51"}
+{"current_steps": 580, "total_steps": 1269, "loss": 0.8661, "learning_rate": 5e-06, "epoch": 1.3711583924349882, "percentage": 45.71, "elapsed_time": "1:05:20", "remaining_time": "1:17:37"}
+{"current_steps": 590, "total_steps": 1269, "loss": 0.8591, "learning_rate": 5e-06, "epoch": 1.3947990543735225, "percentage": 46.49, "elapsed_time": "1:06:22", "remaining_time": "1:16:23"}
+{"current_steps": 600, "total_steps": 1269, "loss": 0.864, "learning_rate": 5e-06, "epoch": 1.4184397163120568, "percentage": 47.28, "elapsed_time": "1:07:24", "remaining_time": "1:15:10"}
+{"current_steps": 610, "total_steps": 1269, "loss": 0.8635, "learning_rate": 5e-06, "epoch": 1.442080378250591, "percentage": 48.07, "elapsed_time": "1:08:27", "remaining_time": "1:13:57"}
+{"current_steps": 620, "total_steps": 1269, "loss": 0.8631, "learning_rate": 5e-06, "epoch": 1.4657210401891252, "percentage": 48.86, "elapsed_time": "1:09:29", "remaining_time": "1:12:44"}
+{"current_steps": 630, "total_steps": 1269, "loss": 0.8618, "learning_rate": 5e-06, "epoch": 1.4893617021276595, "percentage": 49.65, "elapsed_time": "1:10:33", "remaining_time": "1:11:33"}
+{"current_steps": 640, "total_steps": 1269, "loss": 0.864, "learning_rate": 5e-06, "epoch": 1.5130023640661938, "percentage": 50.43, "elapsed_time": "1:11:38", "remaining_time": "1:10:24"}
+{"current_steps": 650, "total_steps": 1269, "loss": 0.8613, "learning_rate": 5e-06, "epoch": 1.5366430260047281, "percentage": 51.22, "elapsed_time": "1:12:41", "remaining_time": "1:09:13"}
+{"current_steps": 660, "total_steps": 1269, "loss": 0.8636, "learning_rate": 5e-06, "epoch": 1.5602836879432624, "percentage": 52.01, "elapsed_time": "1:13:43", "remaining_time": "1:08:01"}
+{"current_steps": 670, "total_steps": 1269, "loss": 0.8636, "learning_rate": 5e-06, "epoch": 1.5839243498817965, "percentage": 52.8, "elapsed_time": "1:14:45", "remaining_time": "1:06:50"}
+{"current_steps": 680, "total_steps": 1269, "loss": 0.8634, "learning_rate": 5e-06, "epoch": 1.607565011820331, "percentage": 53.59, "elapsed_time": "1:15:47", "remaining_time": "1:05:39"}
+{"current_steps": 690, "total_steps": 1269, "loss": 0.8582, "learning_rate": 5e-06, "epoch": 1.6312056737588652, "percentage": 54.37, "elapsed_time": "1:16:50", "remaining_time": "1:04:28"}
+{"current_steps": 700, "total_steps": 1269, "loss": 0.8615, "learning_rate": 5e-06, "epoch": 1.6548463356973995, "percentage": 55.16, "elapsed_time": "1:17:52", "remaining_time": "1:03:18"}
+{"current_steps": 710, "total_steps": 1269, "loss": 0.8612, "learning_rate": 5e-06, "epoch": 1.6784869976359338, "percentage": 55.95, "elapsed_time": "1:18:54", "remaining_time": "1:02:07"}
+{"current_steps": 720, "total_steps": 1269, "loss": 0.8654, "learning_rate": 5e-06, "epoch": 1.702127659574468, "percentage": 56.74, "elapsed_time": "1:19:57", "remaining_time": "1:00:57"}
+{"current_steps": 730, "total_steps": 1269, "loss": 0.8655, "learning_rate": 5e-06, "epoch": 1.7257683215130024, "percentage": 57.53, "elapsed_time": "1:20:59", "remaining_time": "0:59:48"}
+{"current_steps": 740, "total_steps": 1269, "loss": 0.863, "learning_rate": 5e-06, "epoch": 1.7494089834515365, "percentage": 58.31, "elapsed_time": "1:22:02", "remaining_time": "0:58:39"}
+{"current_steps": 750, "total_steps": 1269, "loss": 0.857, "learning_rate": 5e-06, "epoch": 1.773049645390071, "percentage": 59.1, "elapsed_time": "1:23:05", "remaining_time": "0:57:29"}
+{"current_steps": 760, "total_steps": 1269, "loss": 0.8614, "learning_rate": 5e-06, "epoch": 1.7966903073286051, "percentage": 59.89, "elapsed_time": "1:24:07", "remaining_time": "0:56:20"}
+{"current_steps": 770, "total_steps": 1269, "loss": 0.8606, "learning_rate": 5e-06, "epoch": 1.8203309692671394, "percentage": 60.68, "elapsed_time": "1:25:09", "remaining_time": "0:55:11"}
+{"current_steps": 780, "total_steps": 1269, "loss": 0.8603, "learning_rate": 5e-06, "epoch": 1.8439716312056738, "percentage": 61.47, "elapsed_time": "1:26:12", "remaining_time": "0:54:02"}
+{"current_steps": 790, "total_steps": 1269, "loss": 0.8624, "learning_rate": 5e-06, "epoch": 1.867612293144208, "percentage": 62.25, "elapsed_time": "1:27:14", "remaining_time": "0:52:53"}
+{"current_steps": 800, "total_steps": 1269, "loss": 0.8648, "learning_rate": 5e-06, "epoch": 1.8912529550827424, "percentage": 63.04, "elapsed_time": "1:28:16", "remaining_time": "0:51:45"}
+{"current_steps": 810, "total_steps": 1269, "loss": 0.8584, "learning_rate": 5e-06, "epoch": 1.9148936170212765, "percentage": 63.83, "elapsed_time": "1:29:19", "remaining_time": "0:50:36"}
+{"current_steps": 820, "total_steps": 1269, "loss": 0.8615, "learning_rate": 5e-06, "epoch": 1.938534278959811, "percentage": 64.62, "elapsed_time": "1:30:22", "remaining_time": "0:49:28"}
+{"current_steps": 830, "total_steps": 1269, "loss": 0.8603, "learning_rate": 5e-06, "epoch": 1.962174940898345, "percentage": 65.41, "elapsed_time": "1:31:24", "remaining_time": "0:48:20"}
+{"current_steps": 840, "total_steps": 1269, "loss": 0.8586, "learning_rate": 5e-06, "epoch": 1.9858156028368794, "percentage": 66.19, "elapsed_time": "1:32:26", "remaining_time": "0:47:12"}
+{"current_steps": 846, "total_steps": 1269, "eval_loss": 0.9001395106315613, "epoch": 2.0, "percentage": 66.67, "elapsed_time": "1:33:42", "remaining_time": "0:46:51"}
+{"current_steps": 850, "total_steps": 1269, "loss": 0.8393, "learning_rate": 5e-06, "epoch": 2.0094562647754137, "percentage": 66.98, "elapsed_time": "1:38:08", "remaining_time": "0:48:22"}
+{"current_steps": 860, "total_steps": 1269, "loss": 0.8071, "learning_rate": 5e-06, "epoch": 2.033096926713948, "percentage": 67.77, "elapsed_time": "1:39:12", "remaining_time": "0:47:10"}
+{"current_steps": 870, "total_steps": 1269, "loss": 0.8083, "learning_rate": 5e-06, "epoch": 2.0567375886524824, "percentage": 68.56, "elapsed_time": "1:40:14", "remaining_time": "0:45:58"}