Figurative Language in Text Worksheet

GIT: A Generative Image-to-text Transformer for Vision and Language

In this paper, we design and train a Generative Image-to-text Transformer, GIT, to unify vision-language tasks such as image/video captioning and question answering. While generative models provide a ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Feedback

GIT: A Generative Image-to-text Transformer for Vision and Language

Trending now