End of training

Browse files

Files changed (4) hide show

README.md +12 -12
model.safetensors +1 -1
runs/Mar06_16-14-10_Software-AI/events.out.tfevents.1709729051.Software-AI.118212.20 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -34,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1.25e-08
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
@@ -49,10 +49,10 @@ The following hyperparameters were used during training:
 | 5.5993        | 1.0   | 9    | 5.3355          |
 | 5.6986        | 2.0   | 18   | 5.3355          |
 | 5.6845        | 3.0   | 27   | 5.3355          |
-| 5.6477        | 4.0   | 36   | 5.3355          |
 | 5.7219        | 5.0   | 45   | 5.3355          |
-| 5.6463        | 6.0   | 54   | 5.3355          |
-| 5.5946        | 7.0   | 63   | 5.3355          |
 | 5.577         | 8.0   | 72   | 5.3355          |
 | 5.5841        | 9.0   | 81   | 5.3355          |
 | 5.5863        | 10.0  | 90   | 5.3355          |
@@ -60,14 +60,14 @@ The following hyperparameters were used during training:
 | 5.6131        | 12.0  | 108  | 5.3355          |
 | 5.6692        | 13.0  | 117  | 5.3355          |
 | 5.7031        | 14.0  | 126  | 5.3355          |
-| 5.6996        | 15.0  | 135  | 5.3355          |
 | 5.6724        | 16.0  | 144  | 5.3355          |
-| 5.738         | 17.0  | 153  | 5.3355          |
 | 5.6687        | 18.0  | 162  | 5.3355          |
 | 5.7009        | 19.0  | 171  | 5.3355          |
 | 5.6232        | 20.0  | 180  | 5.3355          |
 | 5.6514        | 21.0  | 189  | 5.3355          |
-| 5.6815        | 22.0  | 198  | 5.3355          |
 | 5.6305        | 23.0  | 207  | 5.3355          |
 | 5.7509        | 24.0  | 216  | 5.3355          |
 | 5.6747        | 25.0  | 225  | 5.3355          |
@@ -76,9 +76,9 @@ The following hyperparameters were used during training:
 | 5.673         | 28.0  | 252  | 5.3355          |
 | 5.6222        | 29.0  | 261  | 5.3355          |
 | 5.6194        | 30.0  | 270  | 5.3355          |
-| 5.6945        | 31.0  | 279  | 5.3355          |
 | 5.6899        | 32.0  | 288  | 5.3355          |
-| 5.6166        | 33.0  | 297  | 5.3355          |
 | 5.6643        | 34.0  | 306  | 5.3355          |
 | 5.7039        | 35.0  | 315  | 5.3355          |
 | 5.6704        | 36.0  | 324  | 5.3355          |
@@ -97,7 +97,7 @@ The following hyperparameters were used during training:
 | 5.6381        | 49.0  | 441  | 5.3355          |
 | 5.7056        | 50.0  | 450  | 5.3355          |
 | 5.6693        | 51.0  | 459  | 5.3355          |
-| 5.6051        | 52.0  | 468  | 5.3355          |
 | 5.6551        | 53.0  | 477  | 5.3355          |
 | 5.5851        | 54.0  | 486  | 5.3355          |
 | 5.6209        | 55.0  | 495  | 5.3355          |
@@ -136,11 +136,11 @@ The following hyperparameters were used during training:
 | 5.704         | 88.0  | 792  | 5.3355          |
 | 5.6389        | 89.0  | 801  | 5.3355          |
 | 5.6339        | 90.0  | 810  | 5.3355          |
-| 5.6446        | 91.0  | 819  | 5.3355          |
 | 5.6303        | 92.0  | 828  | 5.3355          |
 | 5.6814        | 93.0  | 837  | 5.3355          |
 | 5.6435        | 94.0  | 846  | 5.3355          |
-| 5.6821        | 95.0  | 855  | 5.3355          |
 | 5.6318        | 96.0  | 864  | 5.3355          |
 | 5.6404        | 97.0  | 873  | 5.3355          |
 | 5.6277        | 98.0  | 882  | 5.3355          |

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 6.25e-09
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
 | 5.5993        | 1.0   | 9    | 5.3355          |
 | 5.6986        | 2.0   | 18   | 5.3355          |
 | 5.6845        | 3.0   | 27   | 5.3355          |
+| 5.6475        | 4.0   | 36   | 5.3355          |
 | 5.7219        | 5.0   | 45   | 5.3355          |
+| 5.6464        | 6.0   | 54   | 5.3355          |
+| 5.5938        | 7.0   | 63   | 5.3355          |
 | 5.577         | 8.0   | 72   | 5.3355          |
 | 5.5841        | 9.0   | 81   | 5.3355          |
 | 5.5863        | 10.0  | 90   | 5.3355          |
 | 5.6131        | 12.0  | 108  | 5.3355          |
 | 5.6692        | 13.0  | 117  | 5.3355          |
 | 5.7031        | 14.0  | 126  | 5.3355          |
+| 5.6995        | 15.0  | 135  | 5.3355          |
 | 5.6724        | 16.0  | 144  | 5.3355          |
+| 5.7379        | 17.0  | 153  | 5.3355          |
 | 5.6687        | 18.0  | 162  | 5.3355          |
 | 5.7009        | 19.0  | 171  | 5.3355          |
 | 5.6232        | 20.0  | 180  | 5.3355          |
 | 5.6514        | 21.0  | 189  | 5.3355          |
+| 5.6814        | 22.0  | 198  | 5.3355          |
 | 5.6305        | 23.0  | 207  | 5.3355          |
 | 5.7509        | 24.0  | 216  | 5.3355          |
 | 5.6747        | 25.0  | 225  | 5.3355          |
 | 5.673         | 28.0  | 252  | 5.3355          |
 | 5.6222        | 29.0  | 261  | 5.3355          |
 | 5.6194        | 30.0  | 270  | 5.3355          |
+| 5.6944        | 31.0  | 279  | 5.3355          |
 | 5.6899        | 32.0  | 288  | 5.3355          |
+| 5.6165        | 33.0  | 297  | 5.3355          |
 | 5.6643        | 34.0  | 306  | 5.3355          |
 | 5.7039        | 35.0  | 315  | 5.3355          |
 | 5.6704        | 36.0  | 324  | 5.3355          |
 | 5.6381        | 49.0  | 441  | 5.3355          |
 | 5.7056        | 50.0  | 450  | 5.3355          |
 | 5.6693        | 51.0  | 459  | 5.3355          |
+| 5.6045        | 52.0  | 468  | 5.3355          |
 | 5.6551        | 53.0  | 477  | 5.3355          |
 | 5.5851        | 54.0  | 486  | 5.3355          |
 | 5.6209        | 55.0  | 495  | 5.3355          |
 | 5.704         | 88.0  | 792  | 5.3355          |
 | 5.6389        | 89.0  | 801  | 5.3355          |
 | 5.6339        | 90.0  | 810  | 5.3355          |
+| 5.6447        | 91.0  | 819  | 5.3355          |
 | 5.6303        | 92.0  | 828  | 5.3355          |
 | 5.6814        | 93.0  | 837  | 5.3355          |
 | 5.6435        | 94.0  | 846  | 5.3355          |
+| 5.6822        | 95.0  | 855  | 5.3355          |
 | 5.6318        | 96.0  | 864  | 5.3355          |
 | 5.6404        | 97.0  | 873  | 5.3355          |
 | 5.6277        | 98.0  | 882  | 5.3355          |

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5eecb9996bb4fea006fe3cc7f32d8fb918cb5febde1228ae575d04caaf66ff0c
 size 649032520

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab9be6398b1ef28aeccbbf53360f659eda0f4a6b6057dc2a61fb6a2574c7b910
 size 649032520

runs/Mar06_16-14-10_Software-AI/events.out.tfevents.1709729051.Software-AI.118212.20 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:74936e54db906aa7bb35b1d27d8256eaef6a40a72a0b2fecca5dae0e366302ca
+size 47442

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a23059489de59322aa5235ee145edb3e49c5d4f5a9bb6df916999b0f546f00b4
 size 4219

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c430db8fc500a359b4a6a01bd5cb4603bb5f7867c427270c1d9ea2938339a7f
 size 4219