اعتبار تصویر: Podcastle
اعتبار تصویر: Podcastle

پلتفرم پادکست Podcastle مدل تبدیل متن به گفتار با بیش از 450 صدای هوش مصنوعی را راه اندازی کرد

اعتبار تصویر: Podcastle
اعتبار تصویر: Podcastle

پلتفرم ضبط و ویرایش پادکست Podcastle اکنون با انتشار مدل هوش مصنوعی خود به نام Asyncflow v1.0 به سایر شرکت ها در مسابقه تبدیل متن به گفتار مبتنی بر هوش مصنوعی می پیوندد. یک API برای توسعه دهندگان نیز در دسترس خواهد بود و به آنها امکان می دهد مستقیماً مدل تبدیل متن به گفتار را در برنامه های خود ادغام کنند.

با تشکر از مدل جدید، این شرکت قادر است بیش از 450 صدای هوش مصنوعی را ارائه دهد که می توانند متن شما را روایت کنند. این استارت آپ گفت که این فناوری و مدل را به گونه ای توسعه داده است که هزینه های آموزش و استنتاج آن پایین است و به آن در برابر رقبا برتری می بخشد.

با این حرکت، Podcastle به تعدادی از استارت آپ ها، از جمله ElevenLabs، Speechify و WellSaid می پیوندد که فناوری و مدل های هوش مصنوعی را برای تبدیل هر نوع متن به یک کلیپ صوتی با روایت هوش مصنوعی توسعه داده اند. این فناوری شامل موارد استفاده ای مانند بازاریابی، تبلیغات، ایجاد محتوا، آموزش و آموزش شرکتی است.

آرتو یریتسیان، بنیانگذار Podcastle، به TechCrunch گفت که این شرکت همیشه می خواسته یک مدل تبدیل متن به گفتار بسازد، اما هزینه آموزش و الزامات داده برای آن بسیار بالا بوده است.

یریتسیان گفت: "ما از زمان شروع به کار می خواستیم یک مدل تبدیل متن به گفتار قوی بسازیم. با این حال، هزینه های توسعه بسیار بالا بود. به لطف پیشرفت‌های اخیر مدل‌های زبان بزرگ، ما توانستیم سال گذشته به پیشرفتی دست پیدا کنیم که به مکانی برسیم که بتوانیم یک مدل صوتی با کیفیت بالا بدون نیاز به حجم زیادی از داده‌ها بسازیم."

این شرکت همچنین در تلاش های خود از طریق دور بودجه 13.5 میلیون دلاری سری A خود در سال گذشته کمک شد.

یریتسیان گفت در حالی که Podcastle حدود 40 دلار برای 500 دقیقه تبدیل متن به گفتار دریافت می کند، ElevenLabs برای همین مقدار 99 دلار دریافت می کند.

ویژگی شبیه سازی صدای Podcastle نیز در حال ارتقا است تا فرآیند سریع تری برای آموزش ایجاد کند.

پیش از این، فرآیند آموزش شامل خواندن تقریباً 70 جمله مختلف بود. اکنون فقط به چند ثانیه ضبط از شما نیاز است تا یک شبیه سازی از صدای خود ایجاد کنید. این فرآیند جدید همچنین از Magic Dust AI پادکست، که سال گذشته منتشر شد، برای بهبود کیفیت ضبط صدا استفاده می کند.

در آزمایش‌های ما، صدایی که با فرآیند جدید ایجاد شد کمی رباتیک به نظر می‌رسید، اگرچه لحن ما را تقلید می‌کرد. این شرکت گفت که با گذشت زمان، این ویژگی را بهبود خواهد داد. به علاوه، می توانید نمونه های مختلفی از صدای خود را برای دریافت نتایج مختلف آموزش دهید.

Podcastle گفت که جدا از هزینه ها، داشتن ابزارهایی برای صدا، ویدئو، پادکست ها و روایت مبتنی بر هوش مصنوعی در یک سایت طراحی شده جدید، به آن نسبت به رقبا برتری می دهد. یریتسیان گفت در حالی که اکثر کاربران از Podcastle برای کار بر روی محتوای صوتی استفاده می کنند، ویدئو نیز به سرعت در حال رسیدن به آن است.