NoMoreCopyrightOrg
/

flux-test4

Inference Endpoints

Model card Files Files and versions Community

John6666 commited on 3 days ago

Commit

9ae3cc2

·

verified ·

1 Parent(s): a3e1aa2

Upload handler.py

Files changed (1) hide show

handler.py +2 -2

handler.py CHANGED Viewed

@@ -67,8 +67,8 @@ def load_pipeline_lowvram(repo_id: str, dtype: torch.dtype) -> Any:
     vae = AutoencoderKL.from_pretrained(repo_id, subfolder="vae", torch_dtype=dtype, quantization_config=float8_config)
     transformer = FluxTransformer2DModel.from_pretrained(repo_id, subfolder="transformer", torch_dtype=dtype, quantization_config=float8_config)
     pipe = FluxPipeline.from_pretrained(repo_id, vae=vae, transformer=transformer, text_encoder_2=load_te2(repo_id, dtype), torch_dtype=dtype, quantization_config=int4_config)
-    pipe.transformer.fuse_qkv_projections()
-    pipe.vae.fuse_qkv_projections()
     pipe.to("cuda")
     return pipe

     vae = AutoencoderKL.from_pretrained(repo_id, subfolder="vae", torch_dtype=dtype, quantization_config=float8_config)
     transformer = FluxTransformer2DModel.from_pretrained(repo_id, subfolder="transformer", torch_dtype=dtype, quantization_config=float8_config)
     pipe = FluxPipeline.from_pretrained(repo_id, vae=vae, transformer=transformer, text_encoder_2=load_te2(repo_id, dtype), torch_dtype=dtype, quantization_config=int4_config)
+    #pipe.transformer.fuse_qkv_projections()
+    #pipe.vae.fuse_qkv_projections()
     pipe.to("cuda")
     return pipe