fineinstructions
/

matching_embedding

@@ -1,16 +1,16 @@
 {
-    "output_dir": "/project_data/data/train_matcher/train-matching-embedding/_checkpoints",
     "overwrite_output_dir": false,
     "do_train": false,
     "do_eval": true,
     "do_predict": false,
-    "eval_strategy": "epoch",
     "prediction_loss_only": false,
-    "per_device_train_batch_size": 8,
-    "per_device_eval_batch_size": 8,
     "per_gpu_train_batch_size": null,
     "per_gpu_eval_batch_size": null,
-    "gradient_accumulation_steps": 1,
     "eval_accumulation_steps": 1,
     "eval_delay": 0,
     "torch_empty_cache_steps": null,
@@ -20,7 +20,7 @@
     "adam_beta2": 0.999,
     "adam_epsilon": 1e-08,
     "max_grad_norm": 1.0,
-    "num_train_epochs": 5,
     "max_steps": -1,
     "lr_scheduler_type": "linear",
     "lr_scheduler_kwargs": {},
@@ -29,14 +29,14 @@
     "log_level": "passive",
     "log_level_replica": "warning",
     "log_on_each_node": true,
-    "logging_dir": "/project_data/data/train_matcher/train-matching-embedding/_checkpoints/runs/Mar03_18-28-25_0b651df549d8",
     "logging_strategy": "steps",
     "logging_first_step": false,
     "logging_steps": 1,
     "logging_nan_inf_filter": true,
-    "save_strategy": "epoch",
-    "save_steps": 500,
-    "save_total_limit": 1,
     "save_safetensors": false,
     "save_on_each_node": false,
     "save_only_model": false,
@@ -61,7 +61,7 @@
     "tpu_metrics_debug": false,
     "debug": [],
     "dataloader_drop_last": false,
-    "eval_steps": null,
     "dataloader_num_workers": 0,
     "dataloader_prefetch_factor": null,
     "past_index": -1,

 {
+    "output_dir": "/mnt/nlpgpu-io1/data/ajayp/output/fineinstructions/dated/2025-03-05-13:09:26/data/train_matcher/train-matching-embedding/_checkpoints",
     "overwrite_output_dir": false,
     "do_train": false,
     "do_eval": true,
     "do_predict": false,
+    "eval_strategy": "steps",
     "prediction_loss_only": false,
+    "per_device_train_batch_size": 1,
+    "per_device_eval_batch_size": 1,
     "per_gpu_train_batch_size": null,
     "per_gpu_eval_batch_size": null,
+    "gradient_accumulation_steps": 8,
     "eval_accumulation_steps": 1,
     "eval_delay": 0,
     "torch_empty_cache_steps": null,
     "adam_beta2": 0.999,
     "adam_epsilon": 1e-08,
     "max_grad_norm": 1.0,
+    "num_train_epochs": 3,
     "max_steps": -1,
     "lr_scheduler_type": "linear",
     "lr_scheduler_kwargs": {},
     "log_level": "passive",
     "log_level_replica": "warning",
     "log_on_each_node": true,
+    "logging_dir": "/mnt/nlpgpu-io1/data/ajayp/output/fineinstructions/dated/2025-03-05-13:09:26/data/train_matcher/train-matching-embedding/_checkpoints/runs/Mar06_20-29-59_nlpgpu04.seas.upenn.edu",
     "logging_strategy": "steps",
     "logging_first_step": false,
     "logging_steps": 1,
     "logging_nan_inf_filter": true,
+    "save_strategy": "steps",
+    "save_steps": 600,
+    "save_total_limit": null,
     "save_safetensors": false,
     "save_on_each_node": false,
     "save_only_model": false,
     "tpu_metrics_debug": false,
     "debug": [],
     "dataloader_drop_last": false,
+    "eval_steps": 600,
     "dataloader_num_workers": 0,
     "dataloader_prefetch_factor": null,
     "past_index": -1,