Abdou
/

vit-swin-base-224-gpt2-image-captioning

vision-encoder-decoder

image-text-to-text

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

vit-swin-base-224-gpt2-image-captioning

2 contributors

History: 7 commits

Abdou's picture

End of training

8eb50e4 almost 2 years ago