Video understanding - a Salwa-Zeitoun Collection

Salwa-Zeitoun 's Collections

Autonomous vehicles (AV)

Video understanding

AI Music Models

Reasoning Capabilities

Multimodal Models

Diffusion models

Video understanding

updated Jan 8, 2025

ByteDance/Sa2VA-1B

Image-Text-to-Text • 1B • Updated Sep 8, 2025 • 983 • 30