مدل‌های جمنای گوگل قابلیت درک بومی ویدیو را اضافه می‌کنند

گوگل قابلیت درک بومی ویدیو را در مدل‌های جمنای خود ادغام کرده است، که به کاربران امکان می‌دهد محتوای یوتیوب را از طریق Google AI Studio تجزیه و تحلیل کنند. کافی است لینک ویدیوی یوتیوب را در درخواست خود وارد کنید. سپس سیستم صدا را رونویسی کرده و فریم‌های ویدیو را در فواصل یک ثانیه‌ای تجزیه و تحلیل می‌کند. برای مثال، می‌توانید به تایم‌استمپ‌های خاصی ارجاع داده و خلاصه‌ها، ترجمه‌ها یا توضیحات بصری را استخراج کنید. این ویژگی که در حال حاضر در مرحله پیش‌نمایش است، امکان پردازش حداکثر ۸ ساعت ویدیو در روز را فراهم می‌کند، با محدودیت یک ویدیوی عمومی در هر درخواست. جمنای پرو (Gemini Pro) ویدیوهایی تا دو ساعت طول را پردازش می‌کند، در حالی که جمنای فلش (Gemini Flash) ویدیوهایی تا یک ساعت را مدیریت می‌کند. این به‌روزرسانی پس از اجرای تولید تصویر بومی در جمنای انجام می‌شود.