Spaces:

aakashv100
/

phi3-oass1-chatbot

Runtime error

Aakash Vardhan commited on Sep 19, 2024

Commit

bb8f386

1 Parent(s): 8a47fff

.

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
 from config import load_config
@@ -19,7 +19,8 @@ if "torch_dtype" in model_config:
     elif model_config["torch_dtype"] == "bfloat16":
         model_config["torch_dtype"] = torch.bfloat16
-model = AutoModelForCausalLM.from_pretrained(model_name, **model_config)
 checkpoint_model = "checkpoint_dir/checkpoint-650"

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, BitsAndBytesConfig
 from config import load_config
     elif model_config["torch_dtype"] == "bfloat16":
         model_config["torch_dtype"] = torch.bfloat16
+quantization_config = BitsAndBytesConfig(load_in_8bit=True)
+model = AutoModelForCausalLM.from_pretrained(model_name, quantization_config=quantization_config, **model_config)
 checkpoint_model = "checkpoint_dir/checkpoint-650"

config.yaml CHANGED Viewed

@@ -4,4 +4,5 @@ model_config:
   trust_remote_code: True
   use_cache: True
   attn_implementation: "eager"
-  device_map: "cpu"

   trust_remote_code: True
   use_cache: True
   attn_implementation: "eager"
+  device_map: "cpu"
+  load_in_8bit: True