Spaces:

GameScribes
/

Multipurpose-AI-Agent-Development

Paused

devve1 commited on Jul 9

Commit

a9ba889

•

1 Parent(s): 49ec730

Update optimum_encoder.py

Files changed (1) hide show

optimum_encoder.py CHANGED Viewed

@@ -10,7 +10,7 @@ from semantic_router.utils.logger import logger
 class OptimumEncoder(BaseEncoder):
-    name: str = "mixedbread-ai/mxbai-embed-large-v1"
     type: str = "huggingface"
     score_threshold: float = 0.5
     tokenizer_kwargs: Dict = {}
@@ -60,13 +60,14 @@ class OptimumEncoder(BaseEncoder):
         provider_options = {
             "trt_engine_cache_enable": True,
-            "trt_engine_cache_path": os.getenv('HF_HOME')
         }
         ort_model = ORTModelForFeatureExtraction.from_pretrained(
             self.name,
-            use_io_binding=True,
-            provider=['TensorrtExecutionProvider'],
             provider_options=provider_options,
             **self.model_kwargs
         )

 class OptimumEncoder(BaseEncoder):
+    name: str = "mixedbread-ai/mxbai-embed-large-v1/onnx/model_fp16.onnx"
     type: str = "huggingface"
     score_threshold: float = 0.5
     tokenizer_kwargs: Dict = {}
         provider_options = {
             "trt_engine_cache_enable": True,
+            "trt_engine_cache_path": os.getenv('HF_HOME'),
+            "trt_fp16_enable": True
         }
         ort_model = ORTModelForFeatureExtraction.from_pretrained(
             self.name,
+            model_save_dir=os.getenv('HF_HOME'),
+            providers=['TensorrtExecutionProvider'],
             provider_options=provider_options,
             **self.model_kwargs
         )