Update model files

Files changed (4) hide show

config.json CHANGED Viewed

@@ -26,7 +26,7 @@
           "Linear"
         ],
         "weights": {
-          "actorder": null,
           "block_structure": null,
           "dynamic": false,
           "group_size": 128,

           "Linear"
         ],
         "weights": {
+          "actorder": "weight",
           "block_structure": null,
           "dynamic": false,
           "group_size": 128,

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ce6ddbca2d055a42ad5a803f9e18ee8ffdff756d74d01253b2e0a988087fac81
 size 4982297672

 version https://git-lfs.github.com/spec/v1
+oid sha256:17264c775027afaa54bf0681021d8c1738169e794cc8b2d427028684fb7637d1
 size 4982297672

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c4cb75c5ceb476d930251e12c8b5a6d1066e59774f2ccb90c2b31be2ceda9d5
 size 1916188912

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1e26c007d7c105f5950e5203707079d17e3e954b29c51d508e48d7369ac937f
 size 1916188912

recipe.yaml CHANGED Viewed

@@ -3,6 +3,10 @@ DEFAULT_stage:
     GPTQModifier:
       sequential_targets: [Qwen2_5_VLDecoderLayer]
       dampening_frac: 0.03
-      scheme: W4A16
       targets: Linear
       ignore: [lm_head, 're:visual.*']

     GPTQModifier:
       sequential_targets: [Qwen2_5_VLDecoderLayer]
       dampening_frac: 0.03
+      config_groups:
+        config_group:
+          targets: [Linear]
+          weights: {num_bits: 4, type: int, symmetric: true, group_size: 128, strategy: group,
+            dynamic: false, actorder: weight, observer: minmax}
       targets: Linear
       ignore: [lm_head, 're:visual.*']