گوگل در حال ارائه یک سری بهروزرسانیهای پیشرفته با هدف بهبود گردش کار خلاقانه با هوش مصنوعی است، از جمله یک ارتقاء قابل توجه برای مدل تولید ویدیو خود، Veo 2.
ویژگیهای جدید - که برای پیشنمایش از طریق پلتفرم Vertex AI Google Cloud در دسترس هستند - به منظور ارائه کنترل بیشتر به کاربران بر سبک سینمایی و ویرایش در فیلمهای تولید شده توسط هوش مصنوعی و فیلمهای دنیای واقعی طراحی شدهاند.
گوگل Veo 2، که توسط Google DeepMind توسعه یافته است، ابزارهای inpainting و outpainting را معرفی میکند. به گفته گوگل، از طریق The Verge، inpainting حذف خودکار "تصاویر پسزمینه ناخواسته، لوگوها یا عوامل مزاحم از ویدیوهای شما" را فعال میکند.
Outpainting قاب ویدیوی اصلی را گسترش میدهد و نواحی جدید را با فیلمهای تولید شده توسط هوش مصنوعی پر میکند که با ظاهر و احساس مواد منبع مطابقت دارد. Outpainting مانند ویژگی Generative Expand Adobe برای تصاویر و inpainting مانند Generative Fill است.
از ویژگی outpainting میتوان برای تغییر ویدیو به نسبت تصویر متفاوت استفاده کرد که برای سازندگان پست در پلتفرمهای مختلف مفید است.
این بهروزرسانی همچنین شاهد معرفی پیشتنظیمهای سینمایی است. اینها به کاربران امکان میدهند تکنیکهای سبکی مانند time-lapse، عکسهای نمای پهپادی یا پانهای دوربین شبیهسازیشده را به سادگی با تگ کردن آنها در دستورات متنی خود اعمال کنند. گوگل مثال زیر از دستورالعمل "pan right" را به اشتراک گذاشت.
Veo 2 همچنین یک ویژگی درونیابی جدید را معرفی میکند که انتقالهای هموار بین دو تصویر ثابت ایجاد میکند و فریمهای میانی را پر میکند تا یک بخش ویدیویی پیوسته تولید کند. مثال زیر.
این بهروزرسانیها برای رقابت با مدل ویدیویی Firefly Adobe قرار گرفتهاند، که اخیراً قابلیتهای تولیدی مشابهی را به Premiere Pro آورده است.
مقاله The Verge نقل قولی از جاستین توماس، که رهبر تجربه دیجیتال در Kraft Heinz است، ارائه میدهد. او میگوید که این ابزارها تیم شرکتی او را قادر میسازند تا وظایفی را در هشت ساعت انجام دهند که "قبلاً هشت هفته طول میکشید".
صدا نیز درخشندگی جدیدی پیدا کرده است. مدل تولید موسیقی گوگل، Lyria، اکنون در پیشنمایش خصوصی است. در همین حال، مدل گفتار آن، Chirp 3، با راهاندازی یک ویژگی "Instant Custom Voice" ارتقاء عمدهای پیدا میکند. این به سیستم اجازه میدهد تا "صداهای سفارشی واقعی را از 10 ثانیه ورودی صدا تولید کند". یک ویژگی رونویسی جدید نیز در حال پیشنمایش است که میتواند بین سخنرانان فردی در مکالمات چند نفره تمایز قائل شود - و رونوشتهای تمیزتر و واضحتری ارائه دهد.