آردوارک (Aardvark)، یک سیستم پیشبینی آبوهوای نوین مبتنی بر یادگیری ماشین، آیندهای را نوید میدهد که در آن ابرکامپیوترها برای پیشبینی اختیاری هستند - اما هنوز دوشاخه آنها را از برق نکشید.
دانشگاهیان وابسته به مؤسسه آلن تورینگ در بریتانیا و سایر مؤسسات ادعا میکنند که یک مدل پیشبینی آبوهوا توسعه دادهاند که میتواند روی یک کامپیوتر رومیزی با کسری از هزینه و زمان فعلی که با استفاده از ابرکامپیوترها صرف میشود، آموزش داده و اجرا شود.
با تکیه بر کارهای انجام شده در دانشگاه کمبریج، ریچارد ترنر، سرپرست تحقیقات هوش مصنوعی برای پیشبینی آبوهوا در مؤسسه آلن تورینگ و استاد یادگیری ماشین در دانشگاه کمبریج، و اسکات هاسکینگ، مدیر موقت علم و نوآوری در مؤسسه آلن تورینگ، بر این باورند که نتایج آردوارک به اندازهای خوب است که میتواند کل خط لوله پیشبینی عددی آبوهوا (NWP) را جایگزین کند.
خط لوله NWP از یک فرآیند سه مرحلهای پیروی میکند. ابتدا، دادههای مشاهداتی از ماهوارهها، بالنهای هواشناسی، ایستگاههای زمینی، کشتیها، هواپیماها و شناورها جمعآوری شده و با یک پیشبینی اخیر ترکیب میشوند تا وضعیت فعلی جو تخمین زده شود. دوم، این تخمین به یک مدل محاسباتی پیچیده داده میشود که فیزیک جو را برای تولید پیشبینیها شبیهسازی میکند. در نهایت، آن پیشبینیهای خام پسپردازش میشوند تا خطاها اصلاح شوند، دقت محلی بهبود یابد و ورودی پیشبینیکنندگان انسانی لحاظ شود.
کارهای اخیر دیگر در بهبود پیشبینی آبوهوا با یادگیری ماشین، مانند مدل GenCast گوگل دیپمایند، بر مرحله دوم - مدل محاسباتی - متمرکز شدهاند، در حالی که گفته میشود آردوارک قادر به جایگزینی هر سه مرحله است.
همانطور که در مقالهای که این ماه در مجله علمی Nature منتشر شد، توضیح داده شده است: «آردوارک پیشبینیهای دقیقی را ارائه میدهد که تولید آنها به مراتب سریعتر از سیستمهای موجود است، بدون هیچ گونه وابستگی به محصولات NWP در زمان استقرار. تولید یک پیشبینی کامل از دادههای مشاهداتی تقریباً یک ثانیه روی چهار پردازنده گرافیکی NVIDIA A100 طول میکشد، در مقایسه با تقریباً ۱۰۰۰ ساعت-گره مورد نیاز HRES برای انجام تنها جذب داده و پیشبینی، قبل از در نظر گرفتن مدلهای محلی پاییندستی و پردازش.»
ادعا میشود که پیشبینی حاصل به اندازه سیستم پیشبینی جهانی (GFS) آمریکا دقیق است. با این حال، تنها به حدود یک دهم دادههای مشاهداتی مورد استفاده در سیستمهای سنتی NWP متکی است.
ترنر به The Register گفت: «ما فقط از ۱۰ درصد دادهها استفاده کردیم زیرا از نظر منابع محاسباتی در آزمایشگاه دانشگاهی من در مقایسه با، مثلاً، شرکتهای فناوری، بسیار محدود هستیم. با دادههای بیشتر، انتظار دارم که سیستم بهتر عمل کند. آردوارک قادر است تنها با استفاده از کسری از دادهها رقابت کند، تا حدی به این دلیل که مدلهای هوش مصنوعی مستقیماً برای حل وظیفه مورد نظر (پیشبینی) آموزش داده میشوند.»
آردوارک هنوز به اصلاحاتی نیاز دارد زیرا هنوز وضوح سیستم پیشبینی یکپارچه (IFS) اروپا را ندارد. با این حال، روی این موضوع کار میشود و محققان انتظار دارند ماژولهای تخصصی مختلفی را برای تمرکز بر انواع خاصی از پیشبینیها مانند طوفانها، سیلها و سایر رویدادهای شدید آبوهوایی اضافه کنند.
آردوارک از سه مؤلفه تشکیل شده است: یک رمزگذار (encoder)، یک پردازشگر (processor) و مجموعهای از ماژولهای رمزگشا (decoder). رمزگذار حدود ۳۱ میلیون پارامتر دارد و آموزش آن ۱۳ ساعت طول میکشد. پردازشگر حاوی حدود ۵۴ میلیون پارامتر است و به هشت ساعت آموزش روی ERA5، یک مجموعه داده آبوهوایی، و سپس ۳ ساعت تنظیم دقیق با استفاده از خروجی رمزگذار نیاز دارد. یازده ماژول رمزگشا وجود دارد که هر کدام حدود ۲ میلیون پارامتر دارند و آموزش آنها ۳۰ دقیقه طول میکشد. با احتساب دو ساعت دیگر برای تنظیم دقیق سرتاسری، آردوارک را میتوان در حدود ۱۰۰ ساعت GPU آموزش داد.
پس از انجام این کار، آردوارک میتواند در عرض چند دقیقه روی یک کامپیوتر رومیزی پیشبینی ایجاد کند. به عنوان نقطه مقایسه، گوگل ادعا میکند که مدل GenCast آن میتواند یک پیشبینی ۱۵ روزه را در هشت دقیقه با استفاده از یک TPU (واحد پردازش تانسور) Google Cloud تولید کند.
کد منبع مرتبط برای تکرار نتایج در مقاله Nature در حال حاضر محدود شده است، اگرچه برنامه این است که در نهایت آردوارک را منتشر کنند.
ترنر گفت: «همه چیز زمانی که نسخه چاپی آردوارک منتشر شود، منبع باز خواهد شد و هر کسی قادر خواهد بود آن را دانلود کرده و سیستم را برای وظایف مورد علاقه خود آموزش دهد.» ®