Spaces:

geekyrakshit
/

medrag

Running

App Files Files Community

geekyrakshit commited on Oct 22, 2024

Commit

8d64162

1 Parent(s): 8bd2693

add: LLMClient

Browse files

Files changed (4) hide show

medrag_multi_modal/assistant/__init__.py +0 -0
medrag_multi_modal/assistant/llm_client.py +96 -0
medrag_multi_modal/utils.py +12 -0
pyproject.toml +6 -0

medrag_multi_modal/assistant/__init__.py ADDED Viewed

File without changes

medrag_multi_modal/assistant/llm_client.py ADDED Viewed

	@@ -0,0 +1,96 @@

+import os
+from enum import Enum
+from typing import Any, Optional, Union
+import instructor
+import weave
+from PIL import Image
+from ..utils import base64_encode_image
+class ClientType(Enum, str):
+    GEMINI = "gemini"
+    MISTRAL = "mistral"
+class LLMClient(weave.Model):
+    model_name: str
+    client_type: ClientType
+    def __init__(self, model_name: str, client_type: ClientType):
+        super().__init__(model_name=model_name, client_type=client_type)
+    @weave.op()
+    def execute_gemini_sdk(
+        self,
+        user_prompt: Union[str, list[str]],
+        system_prompt: Optional[Union[str, list[str]]] = None,
+        schema: Optional[Any] = None,
+    ) -> Union[str, Any]:
+        import google.generativeai as genai
+        genai.configure(api_key=os.environ.get("GOOGLE_API_KEY"))
+        model = genai.GenerativeModel(self.model_name, system_instruction=system_prompt)
+        generation_config = (
+            None
+            if schema is None
+            else genai.GenerationConfig(
+                response_mime_type="application/json", response_schema=list[schema]
+            )
+        )
+        response = model.generate_content(
+            user_prompt, generation_config=generation_config
+        )
+        return response.text if schema is None else response
+    @weave.op()
+    def execute_mistral_sdk(
+        self,
+        user_prompt: Union[str, list[str]],
+        system_prompt: Optional[Union[str, list[str]]] = None,
+        schema: Optional[Any] = None,
+    ) -> Union[str, Any]:
+        from mistralai import Mistral
+        system_prompt = (
+            [system_prompt] if isinstance(system_prompt, str) else system_prompt
+        )
+        user_prompt = [user_prompt] if isinstance(user_prompt, str) else user_prompt
+        messages = [{"type": "text", "text": prompt} for prompt in system_prompt]
+        for prompt in user_prompt:
+            if isinstance(prompt, Image.Image):
+                messages.append(
+                    {
+                        "type": "image_url",
+                        "image_url": base64_encode_image(prompt, "image/png"),
+                    }
+                )
+            else:
+                messages.append({"type": "text", "text": prompt})
+        client = Mistral(api_key=os.environ.get("MISTRAL_API_KEY"))
+        client = instructor.from_mistral(client)
+        response = (
+            client.chat.complete(model=self.model_name, messages=messages)
+            if schema is None
+            else client.messages.create(
+                response_model=schema, messages=messages, temperature=0
+            )
+        )
+        return response.choices[0].message.content
+    @weave.op()
+    def predict(
+        self,
+        user_prompt: Union[str, list[str]],
+        system_prompt: Optional[Union[str, list[str]]] = None,
+        schema: Optional[Any] = None,
+    ) -> Union[str, Any]:
+        if self.client_type == ClientType.GEMINI:
+            return self.execute_gemini_sdk(user_prompt, system_prompt, schema)
+        elif self.client_type == ClientType.MISTRAL:
+            return self.execute_mistral_sdk(user_prompt, system_prompt, schema)
+        else:
+            raise ValueError(f"Invalid client type: {self.client_type}")

medrag_multi_modal/utils.py CHANGED Viewed

@@ -1,4 +1,8 @@
 import torch
 import wandb
@@ -29,3 +33,11 @@ def get_torch_backend():
             return "mps"
         return "cpu"
     return "cpu"

+import base64
+import io
 import torch
+from PIL import Image
 import wandb
             return "mps"
         return "cpu"
     return "cpu"
+def base64_encode_image(image: Image.Image, mimetype: str) -> str:
+    byte_arr = io.BytesIO()
+    image.save(byte_arr, format="PNG")
+    encoded_string = base64.b64encode(byte_arr.getvalue()).decode("utf-8")
+    encoded_string = f"data:{mimetype};base64,{encoded_string}"
+    return str(encoded_string)

pyproject.toml CHANGED Viewed

@@ -38,6 +38,9 @@ dependencies = [
     "semchunk>=2.2.0",
     "tiktoken>=0.8.0",
     "sentence-transformers>=3.2.0",
 ]
 [project.optional-dependencies]
@@ -61,6 +64,9 @@ core = [
     "torch>=2.4.1",
     "weave>=0.51.14",
     "sentence-transformers>=3.2.0",
 ]
 dev = ["pytest>=8.3.3", "isort>=5.13.2", "black>=24.10.0", "ruff>=0.6.9"]

     "semchunk>=2.2.0",
     "tiktoken>=0.8.0",
     "sentence-transformers>=3.2.0",
+    "google-generativeai>=0.8.3",
+    "mistralai>=1.1.0",
+    "instructor>=1.6.3",
 ]
 [project.optional-dependencies]
     "torch>=2.4.1",
     "weave>=0.51.14",
     "sentence-transformers>=3.2.0",
+    "google-generativeai>=0.8.3",
+    "mistralai>=1.1.0",
+    "instructor>=1.6.3",
 ]
 dev = ["pytest>=8.3.3", "isort>=5.13.2", "black>=24.10.0", "ruff>=0.6.9"]