BhashiniSpace_Text_gemma

Runtime error

FlawedLLM commited on May 22

Commit

1cfdffa

•

1 Parent(s): 727f0da

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -43,9 +43,11 @@ import torch
 #     )
 # tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini")
 # Load model directly
-from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
 # quantization_config = BitsAndBytesConfig(
 #         load_in_4bit=True,
 #         bnb_4bit_use_double_quant=True,
@@ -54,7 +56,7 @@ tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
 # )
 # torch_dtype =torch.float16
-model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9",ignore_mismatched_sizes=True).to('cuda')
 @spaces.GPU(duration=300)
 def chunk_it(input_command):

 #     )
 # tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini")
 # Load model directly
+from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig, AutoConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
+config = AutoConfig.from_pretrained(model_id)  # Load configuration
 # quantization_config = BitsAndBytesConfig(
 #         load_in_4bit=True,
 #         bnb_4bit_use_double_quant=True,
 # )
 # torch_dtype =torch.float16
+model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9",config=config, ignore_mismatched_sizes=True).to('cuda')
 @spaces.GPU(duration=300)
 def chunk_it(input_command):