aehrc
/

cxrmate-multi-tf

Feature Extraction

vision-encoder-decoder

Model card Files Files and versions Community

anicolson commited on Jun 28

Commit

c61fffb

•

1 Parent(s): f79fc10

Upload model

Files changed (3) hide show

config.json +1 -1
generation_config.json +1 -1
modelling_multi.py +5 -4

config.json CHANGED Viewed

@@ -2248,5 +2248,5 @@
   "model_type": "vision-encoder-decoder",
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.36.2"
 }

   "model_type": "vision-encoder-decoder",
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.41.2"
 }

generation_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
   "_from_model_config": true,
   "pad_token_id": 0,
-  "transformers_version": "4.36.2"
 }

 {
   "_from_model_config": true,
   "pad_token_id": 0,
+  "transformers_version": "4.41.2"
 }

modelling_multi.py CHANGED Viewed

@@ -6,11 +6,11 @@ import transformers
 from torch.nn import CrossEntropyLoss
 from transformers import PreTrainedTokenizerFast, VisionEncoderDecoderModel
 from transformers.configuration_utils import PretrainedConfig
-from transformers.modeling_outputs import (BaseModelOutput, ModelOutput,
-                                           Seq2SeqLMOutput)
 from transformers.modeling_utils import PreTrainedModel
-from transformers.models.vision_encoder_decoder.configuration_vision_encoder_decoder import \
-    VisionEncoderDecoderConfig
 from transformers.utils import logging
 logger = logging.get_logger(__name__)
@@ -55,6 +55,7 @@ class MultiCvtWithProjectionHead(transformers.CvtPreTrainedModel):
         pixel_values: Optional[torch.Tensor] = None,
         output_hidden_states: Optional[bool] = None,
         return_dict: Optional[bool] = None,
     ) -> Union[Tuple, ModelOutput]:
         return_dict = return_dict if return_dict is not None else self.config.use_return_dict

 from torch.nn import CrossEntropyLoss
 from transformers import PreTrainedTokenizerFast, VisionEncoderDecoderModel
 from transformers.configuration_utils import PretrainedConfig
+from transformers.modeling_outputs import BaseModelOutput, ModelOutput, Seq2SeqLMOutput
 from transformers.modeling_utils import PreTrainedModel
+from transformers.models.vision_encoder_decoder.configuration_vision_encoder_decoder import (
+    VisionEncoderDecoderConfig,
+)
 from transformers.utils import logging
 logger = logging.get_logger(__name__)
         pixel_values: Optional[torch.Tensor] = None,
         output_hidden_states: Optional[bool] = None,
         return_dict: Optional[bool] = None,
+        output_attentions: Optional[bool] = None,
     ) -> Union[Tuple, ModelOutput]:
         return_dict = return_dict if return_dict is not None else self.config.use_return_dict