گوگل قابلیت درک بومی ویدیو را در مدلهای جمنای خود ادغام کرده است، که به کاربران امکان میدهد محتوای یوتیوب را از طریق Google AI Studio تجزیه و تحلیل کنند. کافی است لینک ویدیوی یوتیوب را در درخواست خود وارد کنید. سپس سیستم صدا را رونویسی کرده و فریمهای ویدیو را در فواصل یک ثانیهای تجزیه و تحلیل میکند. برای مثال، میتوانید به تایماستمپهای خاصی ارجاع داده و خلاصهها، ترجمهها یا توضیحات بصری را استخراج کنید. این ویژگی که در حال حاضر در مرحله پیشنمایش است، امکان پردازش حداکثر ۸ ساعت ویدیو در روز را فراهم میکند، با محدودیت یک ویدیوی عمومی در هر درخواست. جمنای پرو (Gemini Pro) ویدیوهایی تا دو ساعت طول را پردازش میکند، در حالی که جمنای فلش (Gemini Flash) ویدیوهایی تا یک ساعت را مدیریت میکند. این بهروزرسانی پس از اجرای تولید تصویر بومی در جمنای انجام میشود.