Model save

Browse files

Files changed (8) hide show

all_results.json +4 -4
model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
train_results.json +4 -4
trainer_state.json +65 -65
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.992,
     "total_flos": 0.0,
-    "train_loss": 0.7627417502864715,
-    "train_runtime": 798.2471,
     "train_samples": 2000,
-    "train_samples_per_second": 2.505,
-    "train_steps_per_second": 0.078
 }

 {
     "epoch": 0.992,
     "total_flos": 0.0,
+    "train_loss": 0.7615542123394627,
+    "train_runtime": 802.2647,
     "train_samples": 2000,
+    "train_samples_per_second": 2.493,
+    "train_steps_per_second": 0.077
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38d5040d27160b24c21d4c9c0e182742cd802ddf22bb0559297a7259e00efc31
 size 4976698672

 version https://git-lfs.github.com/spec/v1
+oid sha256:2fef86d6bc419727e815913d0864fc6143a9e06797a92bc7694e158387164f4f
 size 4976698672

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2d5942d061d9c3c3bcf20dbbae4581747318592ce798ae4a1a89d2e65bb9924
 size 4999802720

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d752f381c7bf27493d4b25acbf7fa46e8b7431f88a9bedd6a6bf9e21fbf9c28
 size 4999802720

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1fb7cc9fc0ae1217b6e36e7e113d7c9fce7cff6b0d9b85b0b360895a13fa136e
 size 4915916176

 version https://git-lfs.github.com/spec/v1
+oid sha256:a489c2438e7429e922b665007cdb6175369757c4d2ef470e69f6d5889a5393bc
 size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e75093158ca8cf68884fb57d1bec7b306ae9598bf106e212c4606ec8eaae8d9
 size 1168138808

 version https://git-lfs.github.com/spec/v1
+oid sha256:925b4b04de518c13f0821f4dddb03e382d145281848209b06ff205ab8df40b4d
 size 1168138808

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.992,
     "total_flos": 0.0,
-    "train_loss": 0.7627417502864715,
-    "train_runtime": 798.2471,
     "train_samples": 2000,
-    "train_samples_per_second": 2.505,
-    "train_steps_per_second": 0.078
 }

 {
     "epoch": 0.992,
     "total_flos": 0.0,
+    "train_loss": 0.7615542123394627,
+    "train_runtime": 802.2647,
     "train_samples": 2000,
+    "train_samples_per_second": 2.493,
+    "train_steps_per_second": 0.077
 }

trainer_state.json CHANGED Viewed

@@ -10,7 +10,7 @@
   "log_history": [
     {
       "epoch": 0.016,
-      "grad_norm": 406.82268355522706,
       "learning_rate": 7.142857142857142e-08,
       "logits/generated": -1.7205866575241089,
       "logits/real": -1.5578112602233887,
@@ -25,102 +25,102 @@
     },
     {
       "epoch": 0.16,
-      "grad_norm": 255.30926008233882,
       "learning_rate": 4.727272727272727e-07,
-      "logits/generated": -1.643042802810669,
-      "logits/real": -1.5913658142089844,
-      "logps/generated": -247.2132110595703,
-      "logps/real": -229.58377075195312,
-      "loss": 0.9075,
-      "rewards/accuracies": 0.5138888955116272,
-      "rewards/generated": 0.033381447196006775,
-      "rewards/margins": 0.06060503050684929,
-      "rewards/real": 0.09398648142814636,
       "step": 10
     },
     {
       "epoch": 0.32,
-      "grad_norm": 126.87007618777977,
       "learning_rate": 3.818181818181818e-07,
-      "logits/generated": -1.6706269979476929,
-      "logits/real": -1.6231067180633545,
-      "logps/generated": -255.0316619873047,
-      "logps/real": -233.18115234375,
-      "loss": 0.8444,
-      "rewards/accuracies": 0.7250000238418579,
-      "rewards/generated": -0.507367730140686,
-      "rewards/margins": 0.4785459637641907,
-      "rewards/real": -0.028821701183915138,
       "step": 20
     },
     {
       "epoch": 0.48,
-      "grad_norm": 58.59915104165316,
       "learning_rate": 2.909090909090909e-07,
-      "logits/generated": -1.6554796695709229,
-      "logits/real": -1.5990644693374634,
-      "logps/generated": -259.2175598144531,
-      "logps/real": -229.8797607421875,
-      "loss": 0.7261,
-      "rewards/accuracies": 0.800000011920929,
-      "rewards/generated": -0.31560593843460083,
-      "rewards/margins": 0.8427440524101257,
-      "rewards/real": 0.5271381139755249,
       "step": 30
     },
     {
       "epoch": 0.64,
-      "grad_norm": 69.00503449133376,
       "learning_rate": 2e-07,
-      "logits/generated": -1.6960480213165283,
-      "logits/real": -1.6210428476333618,
-      "logps/generated": -269.42431640625,
-      "logps/real": -236.22348022460938,
-      "loss": 0.6977,
-      "rewards/accuracies": 0.824999988079071,
-      "rewards/generated": -0.6807600259780884,
-      "rewards/margins": 1.2224102020263672,
-      "rewards/real": 0.5416500568389893,
       "step": 40
     },
     {
       "epoch": 0.8,
-      "grad_norm": 57.46050240577938,
       "learning_rate": 1.0909090909090908e-07,
-      "logits/generated": -1.7112897634506226,
-      "logits/real": -1.6359144449234009,
-      "logps/generated": -271.5468444824219,
-      "logps/real": -238.4114532470703,
-      "loss": 0.6996,
-      "rewards/accuracies": 0.7749999761581421,
-      "rewards/generated": -1.030948519706726,
-      "rewards/margins": 1.2689697742462158,
-      "rewards/real": 0.2380211055278778,
       "step": 50
     },
     {
       "epoch": 0.96,
-      "grad_norm": 104.69079883597416,
       "learning_rate": 1.818181818181818e-08,
-      "logits/generated": -1.7024548053741455,
-      "logits/real": -1.6506109237670898,
-      "logps/generated": -265.20843505859375,
-      "logps/real": -237.0784454345703,
-      "loss": 0.7147,
-      "rewards/accuracies": 0.824999988079071,
-      "rewards/generated": -0.9356173276901245,
-      "rewards/margins": 1.1806285381317139,
-      "rewards/real": 0.24501121044158936,
       "step": 60
     },
     {
       "epoch": 0.992,
       "step": 62,
       "total_flos": 0.0,
-      "train_loss": 0.7627417502864715,
-      "train_runtime": 798.2471,
-      "train_samples_per_second": 2.505,
-      "train_steps_per_second": 0.078
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.016,
+      "grad_norm": 406.3304728752427,
       "learning_rate": 7.142857142857142e-08,
       "logits/generated": -1.7205866575241089,
       "logits/real": -1.5578112602233887,
     },
     {
       "epoch": 0.16,
+      "grad_norm": 270.8324793326741,
       "learning_rate": 4.727272727272727e-07,
+      "logits/generated": -1.6502946615219116,
+      "logits/real": -1.5962095260620117,
+      "logps/generated": -247.24267578125,
+      "logps/real": -229.2892303466797,
+      "loss": 0.9095,
+      "rewards/accuracies": 0.6111111044883728,
+      "rewards/generated": 0.03043537400662899,
+      "rewards/margins": 0.0930033028125763,
+      "rewards/real": 0.12343868613243103,
       "step": 10
     },
     {
       "epoch": 0.32,
+      "grad_norm": 107.75622187322996,
       "learning_rate": 3.818181818181818e-07,
+      "logits/generated": -1.6509218215942383,
+      "logits/real": -1.602124810218811,
+      "logps/generated": -250.4297637939453,
+      "logps/real": -229.20663452148438,
+      "loss": 0.8269,
+      "rewards/accuracies": 0.6625000238418579,
+      "rewards/generated": -0.0471772626042366,
+      "rewards/margins": 0.4158110022544861,
+      "rewards/real": 0.3686337471008301,
       "step": 20
     },
     {
       "epoch": 0.48,
+      "grad_norm": 56.227101064567556,
       "learning_rate": 2.909090909090909e-07,
+      "logits/generated": -1.6684995889663696,
+      "logits/real": -1.6101709604263306,
+      "logps/generated": -259.2822265625,
+      "logps/real": -230.04443359375,
+      "loss": 0.7224,
+      "rewards/accuracies": 0.7749999761581421,
+      "rewards/generated": -0.3220736086368561,
+      "rewards/margins": 0.8327458500862122,
+      "rewards/real": 0.5106722116470337,
       "step": 30
     },
     {
       "epoch": 0.64,
+      "grad_norm": 67.61806680856738,
       "learning_rate": 2e-07,
+      "logits/generated": -1.7005382776260376,
+      "logits/real": -1.6268432140350342,
+      "logps/generated": -267.0151672363281,
+      "logps/real": -235.13064575195312,
+      "loss": 0.7124,
+      "rewards/accuracies": 0.8125,
+      "rewards/generated": -0.43984347581863403,
+      "rewards/margins": 1.0907765626907349,
+      "rewards/real": 0.6509330868721008,
       "step": 40
     },
     {
       "epoch": 0.8,
+      "grad_norm": 64.83403783592586,
       "learning_rate": 1.0909090909090908e-07,
+      "logits/generated": -1.7158596515655518,
+      "logits/real": -1.6438223123550415,
+      "logps/generated": -269.775390625,
+      "logps/real": -237.33114624023438,
+      "loss": 0.711,
+      "rewards/accuracies": 0.7875000238418579,
+      "rewards/generated": -0.8538025617599487,
+      "rewards/margins": 1.199856162071228,
+      "rewards/real": 0.34605351090431213,
       "step": 50
     },
     {
       "epoch": 0.96,
+      "grad_norm": 112.17375370240751,
       "learning_rate": 1.818181818181818e-08,
+      "logits/generated": -1.7108463048934937,
+      "logits/real": -1.6622025966644287,
+      "logps/generated": -264.43609619140625,
+      "logps/real": -236.8936309814453,
+      "loss": 0.7073,
+      "rewards/accuracies": 0.7875000238418579,
+      "rewards/generated": -0.8583856821060181,
+      "rewards/margins": 1.1218775510787964,
+      "rewards/real": 0.2634918689727783,
       "step": 60
     },
     {
       "epoch": 0.992,
       "step": 62,
       "total_flos": 0.0,
+      "train_loss": 0.7615542123394627,
+      "train_runtime": 802.2647,
+      "train_samples_per_second": 2.493,
+      "train_steps_per_second": 0.077
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c7b5ab46cfe9caa7e1ba22a39d38b2d8f60fa402b1de5d1038e9b55ab8a150ae
 size 6392

 version https://git-lfs.github.com/spec/v1
+oid sha256:272c3175b7bf97aba5f7a059b43872d5721fcf13e3d41aa2103487725adbb20e
 size 6392