NoMoreCopyrightOrg
/

flux-test

Inference Endpoints

Model card Files Files and versions Community

John6666 commited on 6 days ago

Commit

3fdb494

·

verified ·

1 Parent(s): 085e7c1

Upload handler.py

Files changed (1) hide show

handler.py +2 -2

handler.py CHANGED Viewed

@@ -16,10 +16,10 @@ if IS_COMPILE:
 def compile_pipeline(pipe) -> Any:
     pipe.transformer.to(memory_format=torch.channels_last)
     #pipe.transformer = torch.compile(pipe.transformer, mode="reduce-overhead", fullgraph=False, dynamic=False, backend="inductor")
-    pipe.transformer = torch.compile(pipe.transformer, mode="default", fullgraph=True, dynamic=False, backend="inductor")
     pipe.vae.to(memory_format=torch.channels_last)
     #pipe.vae = torch.compile(pipe.vae, mode="reduce-overhead", fullgraph=False, dynamic=False, backend="inductor")
-    pipe.vae = torch.compile(pipe.vae, mode="default", fullgraph=True, dynamic=False, backend="inductor")
     return pipe
 class EndpointHandler:

 def compile_pipeline(pipe) -> Any:
     pipe.transformer.to(memory_format=torch.channels_last)
     #pipe.transformer = torch.compile(pipe.transformer, mode="reduce-overhead", fullgraph=False, dynamic=False, backend="inductor")
+    pipe.transformer = torch.compile(pipe.transformer, mode="max-autotune", fullgraph=True)
     pipe.vae.to(memory_format=torch.channels_last)
     #pipe.vae = torch.compile(pipe.vae, mode="reduce-overhead", fullgraph=False, dynamic=False, backend="inductor")
+    pipe.vae = torch.compile(pipe.vae, mode="max-autotune", fullgraph=True)
     return pipe
 class EndpointHandler: