Spaces:

legaltextai
/

test_model

Runtime error

legaltextai commited on 17 days ago

Commit

609a014

verified ·

1 Parent(s): ec7fc4d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,23 @@
 import gradio as gr
 import spaces
-from transformers import pipeline
 import torch
-# Initialize model with explicit dtype
 model = pipeline(
     "text-generation",
     model="unsloth/DeepSeek-R1-Distill-Llama-8B",
-    device_map="auto",
-    torch_dtype=torch.float16,  # Now recognizes 'torch'
-    model_kwargs={"load_in_8bit": True}
 )
 @spaces.GPU(duration=300)  # Increased to 5 minutes
 def chat_response(message, history):
     # Add explicit initialization check

 import gradio as gr
 import spaces
 import torch
+from transformers import BitsAndBytesConfig, pipeline
+quant_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype=torch.float16,
+    bnb_4bit_use_double_quant=True
+)
 model = pipeline(
     "text-generation",
     model="unsloth/DeepSeek-R1-Distill-Llama-8B",
+    quantization_config=quant_config,
+    device_map="auto"
 )
 @spaces.GPU(duration=300)  # Increased to 5 minutes
 def chat_response(message, history):
     # Add explicit initialization check