BhashiniSpace_Text_gemma

Runtime error

FlawedLLM commited on May 22

Commit

4e539da

•

1 Parent(s): 2e2a881

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,13 +46,13 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
-# quantization_config = BitsAndBytesConfig(
-#         load_in_4bit=True,
-#         bnb_4bit_use_double_quant=True,
-#         bnb_4bit_quant_type="nf4",
-#         bnb_4bit_compute_dtype=torch.float16)
 torch_dtype =torch.float16
-model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9",torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True,)
 @spaces.GPU(duration=300)
 def chunk_it(input_command):

 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
+quantization_config = BitsAndBytesConfig(
+        load_in_4bit=True,
+        bnb_4bit_use_double_quant=True,
+        bnb_4bit_quant_type="nf4",
+        bnb_4bit_compute_dtype=torch.float16)
 torch_dtype =torch.float16
+model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9",quantization_config=quantization_config ,)
 @spaces.GPU(duration=300)
 def chunk_it(input_command):