پرندگان در حال مهاجرت
تصویر از BELL HUTLEY

پس از دهه‌ها ناامیدی، ابزارهای یادگیری ماشین در حال باز کردن گنجینه‌ای از داده‌های صوتی برای بوم‌شناسان هستند. یک پرنده کوچک آوازخوان در شب سپتامبر بر فراز ایتاکا، نیویورک پرواز می‌کند. او یکی از ۴ میلیارد پرنده‌ای است که هر ساله به صورت رودخانه‌ای از پرندگان پرواز می‌کنند. در میانه هوا، او صدایی به نام «پرواز شبانه» از خود خارج می‌کند تا با گله‌اش ارتباط برقرار کند. این سیگنال کوتاه‌ترین است، تنها ۵۰ میلی‌ثانیه طول دارد و در جنگل‌ها در وسط شب منتشر می‌شود. اما انسان‌ها با استفاده از میکروفونی که با قیف متمرکز کننده پوشیده شده است، آن را ضبط کرده‌اند. لحظاتی بعد، نرم‌افزاری به نام BirdVoxDetect که نتیجه همکاری بین دانشگاه نیویورک، آزمایشگاه پرنده‌شناسی کرنل و École Centrale de Nantes است، پرنده را شناسایی کرده و آن را تا سطح گونه طبقه‌بندی می‌کند.

زیست‌شناسانی مانند اندرو فارنسورث از دانشگاه کرنل مدت‌ها آرزوی جاسوسی از پرندگان به این روش را داشتند. در جهانی که به دلیل گرمایش جهانی و زیرساخت‌های انسانی که می‌تواند برای آنها کشنده باشد، مانند آسمان‌خراش‌های شیشه‌ای و خطوط برق، پرندگان مهاجر با تهدیدات بسیاری مواجه هستند. دانشمندان برای ردیابی زمان و مکان مهاجرت‌های آنها به ترکیبی از روش‌ها متکی هستند، اما هر یک از این روش‌ها دارای کاستی‌هایی هستند. رادار داپلر، با فیلتر کردن آب و هوا، می‌تواند کل زیست‌توده پرندگان در هوا را شناسایی کند، اما نمی‌تواند آن را به گونه‌های مختلف تقسیم کند. برچسب‌های GPS بر روی پرندگان فردی و مشاهدات دقیق توسط پرنده‌شناسان شهروند به پر کردن این شکاف کمک می‌کند، اما برچسب‌گذاری پرندگان در مقیاس بزرگ یک پیشنهاد گران و تهاجمی است. و یک مشکل کلیدی دیگر وجود دارد: بیشتر پرندگان در شب مهاجرت می‌کنند، زمانی که شناسایی آنها به صورت بصری دشوارتر است و در حالی که بیشتر پرنده‌شناسان در خواب هستند. برای بیش از یک قرن، نظارت صوتی به عنوان روشی که می‌تواند مشکلات پرنده‌شناسان را حل کند، به طرز وسوسه‌انگیزی از دسترس خارج بوده است.

در اواخر دهه ۱۸۰۰، دانشمندان متوجه شدند که پرندگان مهاجر صداهای پرواز شبانه خاص گونه‌ای تولید می‌کنند - «اثر انگشت‌های صوتی». هنگامی که میکروفون‌ها در دهه ۱۹۵۰ به صورت تجاری در دسترس قرار گرفتند، دانشمندان شروع به ضبط پرندگان در شب کردند. فارنسورث برخی از این تحقیقات بوم‌شناسی صوتی را در دهه ۱۹۹۰ رهبری کرد. اما حتی در آن زمان نیز شناسایی صداهای کوتاه، برخی از آنها در لبه محدوده فرکانسی که انسان‌ها می‌توانند بشنوند، چالش‌برانگیز بود. دانشمندان با هزاران نوار مواجه شدند که باید در زمان واقعی و در حالی که به اسپکتروگرام‌هایی که صدا را تجسم می‌کنند نگاه می‌کردند، بررسی می‌کردند. اگرچه فناوری دیجیتال ضبط را آسان‌تر کرد، اما «مشکل همیشگی»، فارنسورث می‌گوید، «این بود که جمع‌آوری مقدار زیادی داده صوتی به طور فزاینده‌ای آسان شد، اما تحلیل حتی بخشی از آن به طور فزاینده‌ای دشوار شد.»

«اندرو قهرمان ماست»، بلو می‌گوید. «تمام چیزی که می‌خواهیم با کامپیوترها تقلید کنیم، اندرو است.» آنها با آموزش BirdVoxDetect، یک شبکه عصبی، برای نادیده گرفتن خطاهایی مانند وزوزهای کم ناشی از آسیب باران به میکروفون‌ها شروع کردند. سپس سیستم را برای شناسایی صداهای پرواز آموزش دادند که بین گونه‌ها (و حتی درون گونه‌ها) متفاوت است و به راحتی می‌تواند با صدای آژیر ماشین یا صدای قورباغه بهاری اشتباه گرفته شود. چالش، لوستانلن می‌گوید، مشابه چالشی بود که یک بلندگوی هوشمند هنگام گوش دادن به «کلمه بیداری» منحصر به فرد خود با آن مواجه است، به جز اینکه در این مورد فاصله از صدای هدف تا میکروفون بسیار بیشتر است (که به معنای نویز پس‌زمینه بیشتری برای جبران است). و البته، دانشمندان نمی‌توانستند صدای منحصر به فردی مانند «الکسا» یا «هی گوگل» را برای محرک خود انتخاب کنند. «برای پرندگان، ما واقعاً این انتخاب را نمی‌کنیم. چارلز داروین این انتخاب را برای ما انجام داد»، او شوخی می‌کند. خوشبختانه، آنها داده‌های آموزشی زیادی برای کار داشتند - تیم فارنسورث هزاران ساعت ضبط را که توسط میکروفون‌ها در ایتاکا جمع‌آوری شده بود، به صورت دستی حاشیه‌نویسی کرده بودند.

با آموزش BirdVoxDetect برای شناسایی صداهای پرواز، وظیفه دشوار دیگری پیش رو بود: آموزش آن برای طبقه‌بندی صداهای شناسایی شده بر اساس گونه، که تعداد کمی از پرنده‌شناسان می‌توانند با گوش انجام دهند. برای مقابله با عدم قطعیت، و به دلیل اینکه داده‌های آموزشی برای هر گونه وجود ندارد، آنها تصمیم به استفاده از یک سیستم سلسله مراتبی گرفتند. به عنوان مثال، برای یک صدای خاص، BirdVoxDetect ممکن است بتواند ترتیب و خانواده پرنده را شناسایی کند، حتی اگر در مورد گونه مطمئن نباشد - درست همانطور که یک پرنده‌شناس ممکن است حداقل صدایی را به عنوان صدای یک پرنده آوازخوان شناسایی کند، چه زرد-رنگ یا قهوه‌ای-رنگ. در آموزش، شبکه عصبی کمتر مجازات می‌شد وقتی که پرندگان نزدیک‌تر به درخت طبقه‌بندی را اشتباه می‌گرفت.

در آگوست گذشته، با پایان هشت سال تحقیق، تیم مقاله‌ای منتشر کرد که الگوریتم‌های یادگیری ماشین BirdVoxDetect را توضیح می‌داد. آنها همچنین نرم‌افزار را به عنوان یک محصول رایگان و منبع باز برای استفاده و تطبیق پرنده‌شناسان منتشر کردند. در یک آزمایش بر روی یک فصل کامل از ضبط‌های مهاجرت که در مجموع ۶۶۷۱ ساعت بود، شبکه عصبی ۲۳۳۱۲۴ صدای پرواز را شناسایی کرد. در یک مطالعه در سال ۲۰۲۲ در مجله بوم‌شناسی کاربردی، تیمی که BirdVoxDetect را آزمایش کرد، دریافت که داده‌های صوتی به اندازه رادار برای تخمین کل زیست‌توده مؤثر است.

BirdVoxDetect بر روی زیرمجموعه‌ای از پرندگان آوازخوان مهاجر آمریکای شمالی کار می‌کند. اما از طریق یادگیری «چند شات»، می‌توان آن را با چند مثال آموزشی برای شناسایی پرندگان دیگر و مشابه آموزش داد. این مانند یادگیری زبانی مشابه زبانی است که قبلاً صحبت می‌کنید، بلو می‌گوید. با میکروفون‌های ارزان، سیستم می‌تواند به مکان‌هایی در سراسر جهان بدون پرنده‌شناسان یا رادار داپلر گسترش یابد، حتی در شرایط ضبط بسیار متفاوت. «اگر به یک کنفرانس بوم‌شناسی صوتی بروید و با تعدادی از افراد صحبت کنید، همه آنها موارد استفاده متفاوتی دارند»، لوستانلن می‌گوید. گام بعدی برای بوم‌شناسی صوتی، او می‌گوید، ایجاد یک مدل پایه است، مانند مدل‌هایی که دانشمندان برای پردازش زبان طبیعی و تحلیل تصویر و ویدئو کار می‌کنند، که برای هر گونه‌ای - حتی فراتر از پرندگان - قابل تنظیم باشد. به این ترتیب، دانشمندان نیازی به ساخت یک BirdVoxDetect جدید برای هر حیوانی که می‌خواهند مطالعه کنند، نخواهند داشت.

پروژه BirdVox اکنون کامل شده است، اما دانشمندان در حال حاضر بر روی الگوریتم‌ها و رویکرد آن کار می‌کنند. بنجامین ون دورن، زیست‌شناس مهاجرت در دانشگاه ایلینوی اربانا-شمپین که بر روی BirdVox کار کرده است، از Nighthawk، یک شبکه عصبی کاربرپسند جدید بر اساس هر دو BirdVoxDetect و برنامه محبوب شناسایی آواز پرندگان Merlin، برای مطالعه پرندگان مهاجر بر فراز شیکاگو و جاهای دیگر در آمریکای شمالی و جنوبی استفاده می‌کند. و دن منیل، که یک آزمایشگاه بوم‌شناسی صوتی در دانشگاه ویندزور را اداره می‌کند، می‌گوید که او مشتاق است Nighthawk را بر روی صداهای پرواز تیمش که در حال حاضر به صورت دستی حاشیه‌نویسی می‌شوند، پس از ضبط توسط میکروفون‌ها در سمت کانادایی دریاچه‌های بزرگ امتحان کند. یکی از نقاط ضعف نظارت صوتی این است که برخلاف رادار، یک میکروفون واحد نمی‌تواند ارتفاع یک پرنده در بالای سر یا جهت حرکت آن را شناسایی کند. آزمایشگاه منیل در حال آزمایش با آرایه‌ای از هشت میکروفون است که می‌تواند برای حل این مشکل مثلث‌بندی کند. جستجو در ضبط‌ها کند بوده است. اما با Nighthawk، تحلیل به طور چشمگیری سرعت خواهد گرفت.

با تهدید پرندگان و دیگر حیوانات مهاجر، منیل می‌گوید، BirdVoxDetect در زمان مناسبی آمد. دانستن دقیق اینکه کدام پرندگان در زمان واقعی در حال پرواز هستند می‌تواند به دانشمندان کمک کند تا بر روی چگونگی عملکرد گونه‌ها و جایی که می‌روند نظارت کنند. این می‌تواند به تلاش‌های عملی حفاظت مانند ابتکارات «چراغ‌ها خاموش» که آسمان‌خراش‌ها را تشویق می‌کند تا در شب خاموش شوند تا از برخورد پرندگان جلوگیری کنند، اطلاع دهد. «بوم‌شناسی صوتی آینده تحقیقات مهاجرت است و ما واقعاً تازه به مرحله‌ای رسیده‌ایم که ابزارهای مناسب را داریم»، او می‌گوید. «این ما را به عصر جدیدی وارد می‌کند.»