jinaai
/

jina-clip-implementation

michael-guenther commited on May 30

Commit

ab448a5

•

1 Parent(s): d7c984c

change use_flash_attn and add x_attention attribute

Files changed (1) hide show

configuration_clip.py CHANGED Viewed

@@ -155,7 +155,8 @@ class JinaCLIPConfig(PretrainedConfig):
         add_projections: bool = False,
         projection_dim: int = 768,
         logit_scale_init_value: float = 2.6592,
-        use_flash_attn: bool = False,
         **kwargs,
     ):
         # If `_config_dict` exist, we use them for the backward compatibility.
@@ -164,7 +165,8 @@ class JinaCLIPConfig(PretrainedConfig):
         text_config_dict: Optional[Dict] = kwargs.pop('text_config_dict', None)
         vision_config_dict: Optional[Dict] = kwargs.pop('vision_config_dict', None)
-        self.use_flash_attn = use_flash_attn
         super().__init__(**kwargs)
@@ -261,8 +263,10 @@ class JinaCLIPConfig(PretrainedConfig):
                 'with default values.'
             )
-        if use_flash_attn:
-            text_config.hf_model_config_kwargs.use_flash_attn = use_flash_attn
         self.text_config = JinaCLIPTextConfig(**text_config)
         self.vision_config = JinaCLIPVisionConfig(**vision_config)

         add_projections: bool = False,
         projection_dim: int = 768,
         logit_scale_init_value: float = 2.6592,
+        use_text_flash_attn: Optional[bool] = None,
+        use_vision_xformers: Optional[bool] = None,
         **kwargs,
     ):
         # If `_config_dict` exist, we use them for the backward compatibility.
         text_config_dict: Optional[Dict] = kwargs.pop('text_config_dict', None)
         vision_config_dict: Optional[Dict] = kwargs.pop('vision_config_dict', None)
+        self.use_text_flash_attn = use_text_flash_attn
+        self.use_vision_xformers = use_vision_xformers
         super().__init__(**kwargs)
                 'with default values.'
             )
+        if use_text_flash_attn:
+            text_config.hf_model_config_kwargs.use_flash_attn = use_text_flash_attn
+        if use_vision_xformers:
+            vision_config.x_attention = use_vision_xformers
         self.text_config = JinaCLIPTextConfig(**text_config)
         self.vision_config = JinaCLIPVisionConfig(**vision_config)