AI4Bharat، آزمایشگاه هوش مصنوعی در IIT Madras، از IndicTrans3-beta، یک مدل ترجمه چند زبانه پیشرفته (SOTA) رونمایی کرد که برای پشتیبانی از ترجمه بین ۲۲ زبان هندی طراحی شده است.
برای آزمایش مدل اینجا کلیک کنید.
این مدل برای ترجمه ماشینی (MT) در سطح سند بهینه شده است و هدف آن ارائه عملکردی در سطح مدلهای ترجمه جهانی پیشرو است.
ویژگیهای کلیدی IndicTrans3 شامل ترجمههای با دقت بالا، پشتیبانی از چندین زبان هندی و بهینهسازی در دنیای واقعی برای کاربردهای گوناگون است.
AI4Bharat همچنین اعلام کرده است که به زودی دادههای آموزشی را منتشر خواهد کرد و به توسعه اکوسیستم هوش مصنوعی متنباز کمک بیشتری خواهد کرد.
میتش خاپرا، رئیس AI4Bharat، در پستی در لینکدین گفت: «در طول ۴ سال گذشته، ما در AI4Bharat در مأموریتی برای تسریع هوش مصنوعی زبان هندی بودهایم — ایجاد مجموعههای داده، مدلها و ابزارهای بزرگ و انتشار همه چیز به صورت متنباز برای جامعه. اکنون، همه مشارکتهای ما در Hugging Face در دسترس است!»
خاپرا همچنین از بنیاد EkStep، Nilekani Philanthropies و Bhashini (MeitY) برای کمک به توسعه تشکر کرد.
IndicTrans2، نسخه قبلی مدل ترجمه چند زبانه، به طور گسترده توسط چندین شرکت هندی برای تحقیق و توسعه هوش مصنوعی مورد استفاده قرار گرفته است.
سال گذشته در ماه نوامبر، AI4Bharat اعلام کرد که BhasaAnuvaad، یک مجموعه داده ترجمه گفتار که برای زبانهای هندی طراحی شده است، را با پوشش ۱۳ زبان و تقریباً ۴۴۴۰۰ ساعت صدا، راهاندازی کرده است.
این بزرگترین منبع ترجمه گفتار در دسترس عموم از نوع خود برای تنوع زبانی هند است.