هوش مصنوعی دلفین‌جما
هوش مصنوعی دلفین‌جما

رونمایی گوگل از هوش مصنوعی دلفین‌جما برای رمزگشایی ارتباطات دلفین‌ها

در تحولی جدید در علم اقیانوس‌شناسی و هوش مصنوعی، گوگل از دلفین‌جما (DolphinGemma)، یک مدل هوش مصنوعی که برای تجزیه و تحلیل و پیش‌بینی صداهای دلفین‌ها طراحی شده است، رونمایی کرد. این ابتکار که در روز ملی دلفین‌ها آغاز شد، نتیجه همکاری بین گوگل، موسسه فناوری جورجیا (Georgia Tech) و پروژه دلفین‌های وحشی (WDP) است که طولانی‌ترین برنامه تحقیقاتی زیرآبی دلفین‌ها در جهان محسوب می‌شود.

رمزگشایی صداهای دلفین

دلفین‌ها از انواع صداها (کلیک‌ها، سوت‌ها و پالس‌های انفجاری) برای برقراری ارتباط استفاده می‌کنند. دانشمندان دهه‌هاست که تلاش می‌کنند معنای این صداها را رمزگشایی کنند. مجموعه داده گسترده WDP که از سال 1985 جمع‌آوری شده است، نسل‌های دلفین‌های خالدار اقیانوس اطلس در باهاما را ثبت می‌کند و الگوهای صوتی را به رفتارهای خاصی مانند جفت‌گیری یا درگیری مرتبط می‌کند.

تیم WDP می‌گوید: «درک هر گونه‌ای نیازمند زمینه عمیق است.» مشاهدات طولانی‌مدت آن‌ها الگوهایی مانند سوت‌های مشخص برای نام‌گذاری و وزوز کلیک در طول شکار یا جفت‌گیری را شناسایی کرده است. این بینش‌ها یک زمینه اساسی برای مدل‌سازی هوش مصنوعی دلفین‌جما ارائه می‌دهند.

معرفی دلفین‌جما

دلفین‌جما بر اساس معماری جما (Gemma) گوگل ساخته شده است - مدل‌های ساده‌شده‌ای که از همان تحقیقات پشت خانواده جمنای (Gemini) به دست آمده‌اند. این مدل با تقریباً 400 میلیون پارامتر، برای پردازش ورودی و خروجی صوتی طراحی شده است و به طور کارآمد بر روی تلفن‌های هوشمند پیکسل (Pixel) که در این زمینه استفاده می‌شوند، اجرا می‌شود.

دلفین‌جما با استفاده از توکنایزه‌سازی SoundStream، صداهای خام دلفین را به دنباله‌هایی تبدیل می‌کند که می‌توان آن‌ها را برای الگوها تجزیه و تحلیل کرد. سپس پیش‌بینی‌هایی را برای صداهای آینده تولید می‌کند، که عملکردی مشابه مدل‌های زبانی بزرگ دارد که کلمه بعدی را در یک جمله پیش‌بینی می‌کنند.

استفاده میدانی با تلفن‌های گوگل پیکسل

این مدل در طول فصل تحقیقاتی فعلی WDP آزمایش می‌شود و به محققان در شناسایی توالی‌های صوتی مکرر کمک می‌کند. هدف این است که در نهایت یک واژگان مشترک با استفاده از صداهای طبیعی و مصنوعی دلفین ایجاد شود.

به موازات دلفین‌جما، WDP و Georgia Tech نیز سیستم CHAT (تله‌متری تقویت شنوایی Cetacean) را پیشرفت می‌دهند، ابزاری برای ارتباط دو طرفه. CHAT از سوت‌های مصنوعی مرتبط با اشیایی که دلفین‌ها از آن لذت می‌برند، استفاده می‌کند.

یک گوگل پیکسل 6 در حال حاضر تجزیه و تحلیل صدای بی‌درنگ را انجام می‌دهد و تکرارهای آینده برای دستگاه‌های پیکسل 9 برنامه‌ریزی شده است و تعامل از طریق بهبود پردازش و قابلیت‌های بلندگو افزایش می‌یابد.

مدل باز برای تحقیقات جهانی

گوگل قصد دارد در تابستان 2025 دلفین‌جما را به عنوان یک مدل باز منتشر کند. در حالی که در ابتدا بر روی دلفین‌های خالدار اقیانوس اطلس آموزش داده شده است، محققان می‌توانند آن را برای سایر گونه‌های سیتاسین (Cetacean) مانند دلفین‌های پوزه‌بطری یا چرخنده تنظیم کنند.

این ابتکار نشان‌دهنده فصل جدیدی در درک زندگی دریایی است. پروژه دلفین‌جما با ترکیب کار میدانی عمیق با هوش مصنوعی پیشرفته، محققان را به هدف دیرینه ارتباط معنادار بین گونه‌ها نزدیک‌تر می‌کند.

برای اطلاعات بیشتر، به وب‌سایت پروژه دلفین‌های وحشی مراجعه کنید.