YingL19
/

gemma_10epoch_1e5_lincoln1

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

YingL19 commited on Dec 4, 2024

Commit

29eb4e7

·

verified ·

1 Parent(s): a6daa92

Update handler.py

Files changed (1) hide show

handler.py +2 -2

handler.py CHANGED Viewed

@@ -34,7 +34,7 @@ class EndpointHandler():
         DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
         model_name = "moka-ai/m3e-base"
         self.config = PeftConfig.from_pretrained("YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
-        self.base_model = AutoModelForCausalLM.from_pretrained("google/gemma-7b")
         self.newmodel = PeftModel.from_pretrained(self.base_model, "YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
         self.tokenizer = AutoTokenizer.from_pretrained("YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
@@ -68,7 +68,7 @@ ASSISTANT:'''
             template=self.prompt_template,
         )
-        embeddings = HuggingFaceEmbeddings(model_name=model_name)
         embeddings.client = SentenceTransformer(model_name, device=DEVICE)
         ragdb = Chroma(persist_directory="/Lincoln_DB", embedding_function=embeddings)

         DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
         model_name = "moka-ai/m3e-base"
         self.config = PeftConfig.from_pretrained("YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
+        self.base_model = AutoModelForCausalLM.from_pretrained("google/gemma-7b",device_map=DEVICE)
         self.newmodel = PeftModel.from_pretrained(self.base_model, "YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
         self.tokenizer = AutoTokenizer.from_pretrained("YingL19/gemma_10epoch_1e5_lincoln1",device_map=DEVICE)
             template=self.prompt_template,
         )
+        embeddings = HuggingFaceEmbeddings(model_name=model_name,model_kwargs={'device':DEVICE})
         embeddings.client = SentenceTransformer(model_name, device=DEVICE)
         ragdb = Chroma(persist_directory="/Lincoln_DB", embedding_function=embeddings)