Model save

Files changed (2) hide show

README.md CHANGED Viewed

@@ -38,15 +38,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 5
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 3
 ### Training results

runs/Sep09_09-53-41_hpcsgn04/events.out.tfevents.1725875633.hpcsgn04.3408738.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:434124a6a4b6e1cb575a5f4bc0b250a3a0cf17981424819ec92cec168a7bc084
-size 6326

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca1800b7611de1f79d4e17dffbf49d708d49384682afa0b47416c43371134398
+size 6674