در تحولی جدید در علم اقیانوسشناسی و هوش مصنوعی، گوگل از دلفینجما (DolphinGemma)، یک مدل هوش مصنوعی که برای تجزیه و تحلیل و پیشبینی صداهای دلفینها طراحی شده است، رونمایی کرد. این ابتکار که در روز ملی دلفینها آغاز شد، نتیجه همکاری بین گوگل، موسسه فناوری جورجیا (Georgia Tech) و پروژه دلفینهای وحشی (WDP) است که طولانیترین برنامه تحقیقاتی زیرآبی دلفینها در جهان محسوب میشود.
رمزگشایی صداهای دلفین
دلفینها از انواع صداها (کلیکها، سوتها و پالسهای انفجاری) برای برقراری ارتباط استفاده میکنند. دانشمندان دهههاست که تلاش میکنند معنای این صداها را رمزگشایی کنند. مجموعه داده گسترده WDP که از سال 1985 جمعآوری شده است، نسلهای دلفینهای خالدار اقیانوس اطلس در باهاما را ثبت میکند و الگوهای صوتی را به رفتارهای خاصی مانند جفتگیری یا درگیری مرتبط میکند.
تیم WDP میگوید: «درک هر گونهای نیازمند زمینه عمیق است.» مشاهدات طولانیمدت آنها الگوهایی مانند سوتهای مشخص برای نامگذاری و وزوز کلیک در طول شکار یا جفتگیری را شناسایی کرده است. این بینشها یک زمینه اساسی برای مدلسازی هوش مصنوعی دلفینجما ارائه میدهند.
معرفی دلفینجما
دلفینجما بر اساس معماری جما (Gemma) گوگل ساخته شده است - مدلهای سادهشدهای که از همان تحقیقات پشت خانواده جمنای (Gemini) به دست آمدهاند. این مدل با تقریباً 400 میلیون پارامتر، برای پردازش ورودی و خروجی صوتی طراحی شده است و به طور کارآمد بر روی تلفنهای هوشمند پیکسل (Pixel) که در این زمینه استفاده میشوند، اجرا میشود.
دلفینجما با استفاده از توکنایزهسازی SoundStream، صداهای خام دلفین را به دنبالههایی تبدیل میکند که میتوان آنها را برای الگوها تجزیه و تحلیل کرد. سپس پیشبینیهایی را برای صداهای آینده تولید میکند، که عملکردی مشابه مدلهای زبانی بزرگ دارد که کلمه بعدی را در یک جمله پیشبینی میکنند.
استفاده میدانی با تلفنهای گوگل پیکسل
این مدل در طول فصل تحقیقاتی فعلی WDP آزمایش میشود و به محققان در شناسایی توالیهای صوتی مکرر کمک میکند. هدف این است که در نهایت یک واژگان مشترک با استفاده از صداهای طبیعی و مصنوعی دلفین ایجاد شود.
به موازات دلفینجما، WDP و Georgia Tech نیز سیستم CHAT (تلهمتری تقویت شنوایی Cetacean) را پیشرفت میدهند، ابزاری برای ارتباط دو طرفه. CHAT از سوتهای مصنوعی مرتبط با اشیایی که دلفینها از آن لذت میبرند، استفاده میکند.
یک گوگل پیکسل 6 در حال حاضر تجزیه و تحلیل صدای بیدرنگ را انجام میدهد و تکرارهای آینده برای دستگاههای پیکسل 9 برنامهریزی شده است و تعامل از طریق بهبود پردازش و قابلیتهای بلندگو افزایش مییابد.
مدل باز برای تحقیقات جهانی
گوگل قصد دارد در تابستان 2025 دلفینجما را به عنوان یک مدل باز منتشر کند. در حالی که در ابتدا بر روی دلفینهای خالدار اقیانوس اطلس آموزش داده شده است، محققان میتوانند آن را برای سایر گونههای سیتاسین (Cetacean) مانند دلفینهای پوزهبطری یا چرخنده تنظیم کنند.
این ابتکار نشاندهنده فصل جدیدی در درک زندگی دریایی است. پروژه دلفینجما با ترکیب کار میدانی عمیق با هوش مصنوعی پیشرفته، محققان را به هدف دیرینه ارتباط معنادار بین گونهها نزدیکتر میکند.
برای اطلاعات بیشتر، به وبسایت پروژه دلفینهای وحشی مراجعه کنید.