تصویری از محصولات هوش مصنوعی آمازون
تصویری از محصولات هوش مصنوعی آمازون

آمازون Nova Sonic و Nova Reel 1.1 را برای هوش مصنوعی تولیدکننده صدا و ویدیو عرضه کرد

آمازون دو محصول جدید به مجموعه هوش مصنوعی تولیدی خود اضافه کرده است: Amazon Nova Sonic، یک مدل پایه برای برنامه‌های کاربردی مبتنی بر صدا، و Amazon Nova Reel 1.1، یک مدل به‌روز شده برای تولید متن به ویدیو.

Nova Sonic تشخیص گفتار، درک و تولید را در یک مدل ادغام می‌کند و نیاز به اجزای جداگانه را از بین می‌برد. سیستم‌های صوتی سنتی شامل خطوط لوله پیچیده‌ای هستند—تبدیل گفتار به متن، پردازش از طریق یک مدل زبانی بزرگ و تبدیل پاسخ به گفتار. به گفته آمازون، این رویکرد «نمی‌تواند زمینه و تفاوت‌های ظریف صوتی حیاتی را حفظ کند.»

این شرکت گفت: «Nova Sonic رویکرد جدیدی را اتخاذ می‌کند.» «این قابلیت‌های درک و تولید را در یک مدل واحد متحد می‌کند.» نتیجه یک عامل صوتی است که نه تنها ورودی کاربر را درک می‌کند، بلکه با لحن، سرعت و سبک مناسب نیز پاسخ می‌دهد.

این مدل از طریق Amazon Bedrock در دسترس است. از برنامه‌های کاربردی در خدمات مشتری، مسافرت، آموزش، مراقبت‌های بهداشتی و سرگرمی پشتیبانی می‌کند. در یک مثال به اشتراک گذاشته شده توسط آمازون، یک دستیار مسافرتی مجازی لحن خود را در پاسخ به تغییر احساسات مشتری تغییر می‌دهد—هنگامی که نگرانی‌ها در مورد هزینه مطرح می‌شود، از مشتاقانه به اطمینان‌بخش تبدیل می‌شود. یکی دیگر از موارد استفاده شامل یک دستیار داشبورد سازمانی است که پاسخ‌ها را در داده‌های شرکت قرار می‌دهد و گفتگوی چند نوبتی را بدون نیاز به تنظیم مجدد زمینه توسط کاربران حفظ می‌کند.

Nova Sonic همچنین رونوشت‌هایی از گفتار کاربر تولید می‌کند. این ویژگی به توسعه‌دهندگان اجازه می‌دهد تا APIها و ابزارهای خارجی را ادغام کنند و عوامل هوش مصنوعی را قادر می‌سازد تا وظایفی مانند بازیابی گزینه‌های پرواز یا دسترسی به داشبوردهای داخلی را انجام دهند.

از طرف دیگر، Nova Reel 1.1 ویدیوهای چند صحنه‌ای تا دو دقیقه را با سبک بصری سازگار در بخش‌های ۶ ثانیه‌ای امکان‌پذیر می‌کند. از نظر سرعت و انسجام تولید نسبت به نسخه قبلی بهبود یافته است. کاربران می‌توانند انتخاب کنند که یک اعلان واحد را برای کل ویدیو ارائه دهند یا اعلان‌های فردی را برای هر شات برای کنترل بیشتر تنظیم کنند.

این مدل از موارد استفاده مانند کمپین‌های بازاریابی، نمایشگاه‌های طراحی محصول و ایجاد محتوای رسانه‌های اجتماعی پشتیبانی می‌کند. آمازون گفت: «Nova Reel بهره‌وری خلاقانه را افزایش می‌دهد و در عین حال به کاهش زمان و هزینه تولید ویدیو با استفاده از هوش مصنوعی تولیدی کمک می‌کند.»

برای شروع کار با Amazon Nova Reel 1.1، کاربران باید از کنسول Amazon Bedrock بازدید کرده و درخواست دسترسی به مدل را ارائه دهند. در پنل ناوبری سمت چپ، باید «دسترسی به مدل» را انتخاب کرده و سپس Amazon Nova Reel را در لیست مدل‌های موجود پیدا کنند. درخواست دسترسی در اینجا مجوز استفاده از هر دو نسخه 1.0 و 1.1 مدل را فراهم می‌کند. پس از اعطای دسترسی، کاربران می‌توانند با استفاده از کنسول Amazon Bedrock، AWS SDK یا AWS Command Line Interface (CLI) شروع به استفاده از Amazon Nova Reel 1.1 کنند.

این نسخه‌ها بخشی از خانواده گسترده‌تر مدل Nova آمازون هستند که در re:Invent 2024 معرفی شد و شامل Nova Micro، Lite و Pro نیز می‌شود که متن را از روش‌های مختلف تولید می‌کنند.