AI4Bharat اعلام کرده است که به زودی داده‌های آموزشی را منتشر خواهد کرد و به توسعه اکوسیستم هوش مصنوعی متن‌باز کمک بیشتری خواهد کرد.
AI4Bharat اعلام کرده است که به زودی داده‌های آموزشی را منتشر خواهد کرد و به توسعه اکوسیستم هوش مصنوعی متن‌باز کمک بیشتری خواهد کرد.

عرضه IndicTrans3 توسط AI4Bharat برای ۲۲ زبان هندی

AI4Bharat، آزمایشگاه هوش مصنوعی در IIT Madras، از IndicTrans3-beta، یک مدل ترجمه چند زبانه پیشرفته (SOTA) رونمایی کرد که برای پشتیبانی از ترجمه بین ۲۲ زبان هندی طراحی شده است.

برای آزمایش مدل اینجا کلیک کنید.

این مدل برای ترجمه ماشینی (MT) در سطح سند بهینه شده است و هدف آن ارائه عملکردی در سطح مدل‌های ترجمه جهانی پیشرو است.

ویژگی‌های کلیدی IndicTrans3 شامل ترجمه‌های با دقت بالا، پشتیبانی از چندین زبان هندی و بهینه‌سازی در دنیای واقعی برای کاربردهای گوناگون است.

AI4Bharat همچنین اعلام کرده است که به زودی داده‌های آموزشی را منتشر خواهد کرد و به توسعه اکوسیستم هوش مصنوعی متن‌باز کمک بیشتری خواهد کرد.

میتش خاپرا، رئیس AI4Bharat، در پستی در لینکدین گفت: «در طول ۴ سال گذشته، ما در AI4Bharat در مأموریتی برای تسریع هوش مصنوعی زبان هندی بوده‌ایم — ایجاد مجموعه‌های داده، مدل‌ها و ابزارهای بزرگ و انتشار همه چیز به صورت متن‌باز برای جامعه. اکنون، همه مشارکت‌های ما در Hugging Face در دسترس است!»

خاپرا همچنین از بنیاد EkStep، Nilekani Philanthropies و Bhashini (MeitY) برای کمک به توسعه تشکر کرد.

IndicTrans2، نسخه قبلی مدل ترجمه چند زبانه، به طور گسترده توسط چندین شرکت هندی برای تحقیق و توسعه هوش مصنوعی مورد استفاده قرار گرفته است.

سال گذشته در ماه نوامبر، AI4Bharat اعلام کرد که BhasaAnuvaad، یک مجموعه داده ترجمه گفتار که برای زبان‌های هندی طراحی شده است، را با پوشش ۱۳ زبان و تقریباً ۴۴۴۰۰ ساعت صدا، راه‌اندازی کرده است.

این بزرگترین منبع ترجمه گفتار در دسترس عموم از نوع خود برای تنوع زبانی هند است.

بخوانید: چرا هند به AI4Bharatهای بیشتری نیاز دارد