مدل‌های جمنای گوگل قابلیت درک بومی ویدیو را اضافه می‌کنند

نویسنده: ماتیاس باستیان تاریخ انتشار: 2024-03-16 منتشر شده در: The Decoder ترجمه و بازنویسی هوشمند از the decoder

گوگل قابلیت درک بومی ویدیو را در مدل‌های جمنای خود ادغام کرده است، که به کاربران امکان می‌دهد محتوای یوتیوب را از طریق Google AI Studio تجزیه و تحلیل کنند. کافی است لینک ویدیوی یوتیوب را در درخواست خود وارد کنید. سپس سیستم صدا را رونویسی کرده و فریم‌های ویدیو را در فواصل یک ثانیه‌ای تجزیه و تحلیل می‌کند. برای مثال، می‌توانید به تایم‌استمپ‌های خاصی ارجاع داده و خلاصه‌ها، ترجمه‌ها یا توضیحات بصری را استخراج کنید. این ویژگی که در حال حاضر در مرحله پیش‌نمایش است، امکان پردازش حداکثر ۸ ساعت ویدیو در روز را فراهم می‌کند، با محدودیت یک ویدیوی عمومی در هر درخواست. جمنای پرو (Gemini Pro) ویدیوهایی تا دو ساعت طول را پردازش می‌کند، در حالی که جمنای فلش (Gemini Flash) ویدیوهایی تا یک ساعت را مدیریت می‌کند. این به‌روزرسانی پس از اجرای تولید تصویر بومی در جمنای انجام می‌شود.

برچسب‌ها هوش مصنوعی جمنای گوگل درک ویدیو Google AI Studio Gemini Pro Gemini Flash

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: the decoder