goendalf666
/

falcon-7b-sql-instruction-lora

Model card Files Files and versions Community

tom813 commited on Jul 3, 2023

Commit

7e8a666

•

1 Parent(s): 1c480f3

15000 update

Files changed (5) hide show

adapter_model.bin +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +21 -3

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed411523e825514d3a68061cdafdc3807eb42d802ff4f39fa2958d1ae57fe545
 size 261189898

 version https://git-lfs.github.com/spec/v1
+oid sha256:58ff9f13fe4fd43916c511c4e7a58027c1ce30fb6b7744815a66a31aa378e9d7
 size 261189898

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96599b7ccdf5b3a524ac5736c85b602d224dd22026f48a1002f23017f67c0b9f
 size 1044540346

 version https://git-lfs.github.com/spec/v1
+oid sha256:7318a7e6b468b1f60f77c2df735b4138a4972075a7f9d23b7cbbc3ea18158b34
 size 1044540346

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:53de026ea02239c8920d0a8191312db2f91442b4779f916d3bb9e22f1bcba98b
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:453bd6991fe36c7874b91d8fe044905b7822553a1079f2afd925646c3b124eb5
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0bd3d777aeaba0b41d9a03c6730b70ea7cfcb24e68ae7498f71468201e53ab38
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:25d9b43d9967cc267ee69f422bfad8c170bd37836e9da711be203c8963d6971e
 size 1064

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.853658536585366,
-  "global_step": 6000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -18,11 +18,29 @@
       "learning_rate": 0.0002,
       "loss": 0.2937,
       "step": 6000
     }
   ],
   "max_steps": 30000,
   "num_train_epochs": 30,
-  "total_flos": 1.26953109061632e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 14.634146341463415,
+  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.0002,
       "loss": 0.2937,
       "step": 6000
+    },
+    {
+      "epoch": 8.78,
+      "learning_rate": 0.0002,
+      "loss": 1.5565,
+      "step": 9000
+    },
+    {
+      "epoch": 11.71,
+      "learning_rate": 0.0002,
+      "loss": 1.4597,
+      "step": 12000
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 0.0002,
+      "loss": 1.3908,
+      "step": 15000
     }
   ],
   "max_steps": 30000,
   "num_train_epochs": 30,
+  "total_flos": 3.1738277265408e+18,
   "trial_name": null,
   "trial_params": null
 }