Spaces:

GameScribes
/

Multipurpose-AI-Agent-Development

Sleeping

devve1 commited on 2 days ago

Commit

c825289

•

1 Parent(s): 2e65f49

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -244,7 +244,7 @@ def load_models_and_documents():
             tensor_parallel_size=1,
             enforce_eager=True,
             gpu_memory_utilization=1,
-            max_model_len=10240,
             dtype=torch.float16,
             max_num_seqs=64,
             quantization="gptq"

             tensor_parallel_size=1,
             enforce_eager=True,
             gpu_memory_utilization=1,
+            max_model_len=8192,
             dtype=torch.float16,
             max_num_seqs=64,
             quantization="gptq"