هوش مصنوعی Amazon Nova Sonic فقط صدای شما را نمی‌شنود، بلکه نشانه‌های لحنی را نیز درک می‌کند

مدل پایه از گفتار دو طرفه بی‌درنگ پشتیبانی می‌کند

معرفی Amazon Nova Sonic

آمازون یک مدل پایه را معرفی کرده است که ادعا می‌کند نه تنها آنچه را که می‌گویید درک می‌کند، بلکه نحوه بیان شما – لحن، تردید و موارد دیگر را نیز می‌فهمد.

Amazon Nova Sonic، آخرین عضو خانواده مدل‌های پایه Nova که اولین بار در دسامبر ۲۰۲۴ معرفی شد، ورودی گفتاری را می‌پذیرد و با گفتار بی‌درنگ پاسخ می‌دهد، در حالی که یک رونویس نیز برای توسعه‌دهندگان تولید می‌کند.

قابلیت‌های کلیدی

به طور سنتی، برنامه‌های هوش مصنوعی مبتنی بر صدا، سه مدل جداگانه را به هم متصل می‌کنند: یکی برای تشخیص گفتار، یکی برای تولید پاسخ و یکی برای سنتز گفتار. آمازون ادعا می‌کند Nova Sonic این قابلیت‌ها را در یک مدل واحد متحد می‌کند.

آمازون در اعلامیه خود گفت: «این وحدت به مدل اجازه می‌دهد تا پاسخ صوتی تولید شده را با زمینه صوتی (به عنوان مثال، لحن، سبک) و ورودی گفتاری تطبیق دهد و در نتیجه گفتگوی طبیعی‌تری ایجاد شود. Nova Sonic حتی تفاوت‌های ظریف مکالمه انسانی، از جمله مکث‌ها و تردیدهای طبیعی گوینده را درک می‌کند، منتظر می‌ماند تا در زمان مناسب صحبت کند و به طرز ماهرانه‌ای با مداخله‌ها برخورد می‌کند.»