VideoLLaMA 2 - a DAMO-NLP-SG Collection

DAMO-NLP-SG 's Collections

Inf-CL

DiGIT

VideoLLaMA 2

updated 6 days ago

Optimized VideoLLaMA with improved spatial-temporal modeling and better audio understanding capability

Running on Zero

111

🎥📸💬

VideoLLaMA2

Media understanding
Running on Zero

4

🚀

VideoLLaMA2 AV

VideoLLaMA2-AV
DAMO-NLP-SG/VideoLLaMA2.1-7B-16F

Visual Question Answering • Updated 20 days ago • 2.89k • 6
DAMO-NLP-SG/VideoLLaMA2.1-7B-AV

Visual Question Answering • Updated 16 days ago • 622 • 8
DAMO-NLP-SG/VideoLLaMA2-7B-16F

Visual Question Answering • Updated Aug 13 • 1.61k • 13
DAMO-NLP-SG/VideoLLaMA2-7B

Visual Question Answering • Updated Aug 13 • 26.1k • 38
DAMO-NLP-SG/VideoLLaMA2-72B

Visual Question Answering • Updated Aug 14 • 573 • 9
DAMO-NLP-SG/VideoLLaMA2-8x7B

Visual Question Answering • Updated Aug 13 • 133 • 3
DAMO-NLP-SG/VideoLLaMA2-72B-Base

Visual Question Answering • Updated Aug 13 • 42 • 1
DAMO-NLP-SG/VideoLLaMA2-7B-Base

Visual Question Answering • Updated Aug 13 • 2.48k • 5
DAMO-NLP-SG/VideoLLaMA2-7B-16F-Base

Visual Question Answering • Updated Aug 13 • 155 • 2
DAMO-NLP-SG/VideoLLaMA2-8x7B-Base

Visual Question Answering • Updated Aug 13 • 44 • 2
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs

Paper • 2406.07476 • Published Jun 11 • 32
DAMO-NLP-SG/Multi-Source-Video-Captioning

Viewer • Updated Jun 17 • 1.5k • 53 • 6
DAMO-NLP-SG/VideoLLaMA2.1-7B-16F-Base

Visual Question Answering • Updated 20 days ago • 355 • 1