آمازون دو محصول جدید به مجموعه هوش مصنوعی تولیدی خود اضافه کرده است: Amazon Nova Sonic، یک مدل پایه برای برنامههای کاربردی مبتنی بر صدا، و Amazon Nova Reel 1.1، یک مدل بهروز شده برای تولید متن به ویدیو.
Nova Sonic تشخیص گفتار، درک و تولید را در یک مدل ادغام میکند و نیاز به اجزای جداگانه را از بین میبرد. سیستمهای صوتی سنتی شامل خطوط لوله پیچیدهای هستند—تبدیل گفتار به متن، پردازش از طریق یک مدل زبانی بزرگ و تبدیل پاسخ به گفتار. به گفته آمازون، این رویکرد «نمیتواند زمینه و تفاوتهای ظریف صوتی حیاتی را حفظ کند.»
این شرکت گفت: «Nova Sonic رویکرد جدیدی را اتخاذ میکند.» «این قابلیتهای درک و تولید را در یک مدل واحد متحد میکند.» نتیجه یک عامل صوتی است که نه تنها ورودی کاربر را درک میکند، بلکه با لحن، سرعت و سبک مناسب نیز پاسخ میدهد.
این مدل از طریق Amazon Bedrock در دسترس است. از برنامههای کاربردی در خدمات مشتری، مسافرت، آموزش، مراقبتهای بهداشتی و سرگرمی پشتیبانی میکند. در یک مثال به اشتراک گذاشته شده توسط آمازون، یک دستیار مسافرتی مجازی لحن خود را در پاسخ به تغییر احساسات مشتری تغییر میدهد—هنگامی که نگرانیها در مورد هزینه مطرح میشود، از مشتاقانه به اطمینانبخش تبدیل میشود. یکی دیگر از موارد استفاده شامل یک دستیار داشبورد سازمانی است که پاسخها را در دادههای شرکت قرار میدهد و گفتگوی چند نوبتی را بدون نیاز به تنظیم مجدد زمینه توسط کاربران حفظ میکند.
Nova Sonic همچنین رونوشتهایی از گفتار کاربر تولید میکند. این ویژگی به توسعهدهندگان اجازه میدهد تا APIها و ابزارهای خارجی را ادغام کنند و عوامل هوش مصنوعی را قادر میسازد تا وظایفی مانند بازیابی گزینههای پرواز یا دسترسی به داشبوردهای داخلی را انجام دهند.
از طرف دیگر، Nova Reel 1.1 ویدیوهای چند صحنهای تا دو دقیقه را با سبک بصری سازگار در بخشهای ۶ ثانیهای امکانپذیر میکند. از نظر سرعت و انسجام تولید نسبت به نسخه قبلی بهبود یافته است. کاربران میتوانند انتخاب کنند که یک اعلان واحد را برای کل ویدیو ارائه دهند یا اعلانهای فردی را برای هر شات برای کنترل بیشتر تنظیم کنند.
این مدل از موارد استفاده مانند کمپینهای بازاریابی، نمایشگاههای طراحی محصول و ایجاد محتوای رسانههای اجتماعی پشتیبانی میکند. آمازون گفت: «Nova Reel بهرهوری خلاقانه را افزایش میدهد و در عین حال به کاهش زمان و هزینه تولید ویدیو با استفاده از هوش مصنوعی تولیدی کمک میکند.»
برای شروع کار با Amazon Nova Reel 1.1، کاربران باید از کنسول Amazon Bedrock بازدید کرده و درخواست دسترسی به مدل را ارائه دهند. در پنل ناوبری سمت چپ، باید «دسترسی به مدل» را انتخاب کرده و سپس Amazon Nova Reel را در لیست مدلهای موجود پیدا کنند. درخواست دسترسی در اینجا مجوز استفاده از هر دو نسخه 1.0 و 1.1 مدل را فراهم میکند. پس از اعطای دسترسی، کاربران میتوانند با استفاده از کنسول Amazon Bedrock، AWS SDK یا AWS Command Line Interface (CLI) شروع به استفاده از Amazon Nova Reel 1.1 کنند.
این نسخهها بخشی از خانواده گستردهتر مدل Nova آمازون هستند که در re:Invent 2024 معرفی شد و شامل Nova Micro، Lite و Pro نیز میشود که متن را از روشهای مختلف تولید میکنند.