این کابوی در حال قدم زدن با هوش مصنوعی است. | Google Veo 2
این کابوی در حال قدم زدن با هوش مصنوعی است. | Google Veo 2

اضافه شدن کنترل‌های سینمایی، Outpainting و Inpainting به مدل ویدیویی هوش مصنوعی Veo 2 گوگل

گوگل در حال ارائه یک سری به‌روزرسانی‌های پیشرفته با هدف بهبود گردش کار خلاقانه با هوش مصنوعی است، از جمله یک ارتقاء قابل توجه برای مدل تولید ویدیو خود، Veo 2.

ویژگی‌های جدید - که برای پیش‌نمایش از طریق پلتفرم Vertex AI Google Cloud در دسترس هستند - به منظور ارائه کنترل بیشتر به کاربران بر سبک سینمایی و ویرایش در فیلم‌های تولید شده توسط هوش مصنوعی و فیلم‌های دنیای واقعی طراحی شده‌اند.

گوگل Veo 2، که توسط Google DeepMind توسعه یافته است، ابزارهای inpainting و outpainting را معرفی می‌کند. به گفته گوگل، از طریق The Verge، inpainting حذف خودکار "تصاویر پس‌زمینه ناخواسته، لوگوها یا عوامل مزاحم از ویدیوهای شما" را فعال می‌کند.

Outpainting قاب ویدیوی اصلی را گسترش می‌دهد و نواحی جدید را با فیلم‌های تولید شده توسط هوش مصنوعی پر می‌کند که با ظاهر و احساس مواد منبع مطابقت دارد. Outpainting مانند ویژگی Generative Expand Adobe برای تصاویر و inpainting مانند Generative Fill است.

مقایسه قاب ویدیوی اصلی و قاب ویدیوی outpainted
مقایسه قاب ویدیوی اصلی و قاب ویدیوی گسترش یافته با outpainting.

از ویژگی outpainting می‌توان برای تغییر ویدیو به نسبت تصویر متفاوت استفاده کرد که برای سازندگان پست در پلتفرم‌های مختلف مفید است.

این به‌روزرسانی همچنین شاهد معرفی پیش‌تنظیم‌های سینمایی است. اینها به کاربران امکان می‌دهند تکنیک‌های سبکی مانند time-lapse، عکس‌های نمای پهپادی یا پان‌های دوربین شبیه‌سازی‌شده را به سادگی با تگ کردن آنها در دستورات متنی خود اعمال کنند. گوگل مثال زیر از دستورالعمل "pan right" را به اشتراک گذاشت.

Veo 2 همچنین یک ویژگی درون‌یابی جدید را معرفی می‌کند که انتقال‌های هموار بین دو تصویر ثابت ایجاد می‌کند و فریم‌های میانی را پر می‌کند تا یک بخش ویدیویی پیوسته تولید کند. مثال زیر.

شخصیت متحرک در حال حرکت در یک شهر نئونی
شخصیت متحرک در حال حرکت در یک شهر نئونی با استفاده از ویژگی درون‌یابی.
مقایسه تصویر تقسیم شده که حذف شیء را نشان می دهد
مدل متن به تصویر گوگل، Imagen 3، نیز هوشمندتر می‌شود. ویژگی‌های ویرایش جدید وعده نتایج "به‌طور قابل توجهی" بهتر برای حذف خودکار شیء را می‌دهند.

این به‌روزرسانی‌ها برای رقابت با مدل ویدیویی Firefly Adobe قرار گرفته‌اند، که اخیراً قابلیت‌های تولیدی مشابهی را به Premiere Pro آورده است.

مقاله The Verge نقل قولی از جاستین توماس، که رهبر تجربه دیجیتال در Kraft Heinz است، ارائه می‌دهد. او می‌گوید که این ابزارها تیم شرکتی او را قادر می‌سازند تا وظایفی را در هشت ساعت انجام دهند که "قبلاً هشت هفته طول می‌کشید".

صدا نیز درخشندگی جدیدی پیدا کرده است. مدل تولید موسیقی گوگل، Lyria، اکنون در پیش‌نمایش خصوصی است. در همین حال، مدل گفتار آن، Chirp 3، با راه‌اندازی یک ویژگی "Instant Custom Voice" ارتقاء عمده‌ای پیدا می‌کند. این به سیستم اجازه می‌دهد تا "صداهای سفارشی واقعی را از 10 ثانیه ورودی صدا تولید کند". یک ویژگی رونویسی جدید نیز در حال پیش‌نمایش است که می‌تواند بین سخنرانان فردی در مکالمات چند نفره تمایز قائل شود - و رونوشت‌های تمیزتر و واضح‌تری ارائه دهد.