آردوارک در پیش‌بینی آب‌وهوا از موش‌خرمای کوهی و ابرکامپیوترها پیشی می‌گیرد

پیش‌بینی می‌شود مدل پیش‌بینی یادگیری ماشین به اندازه کامپیوتر شخصی به خوبی یک ابرکامپیوتر و با کسری از هزینه عمل کند.

آردوارک (Aardvark)، یک سیستم پیش‌بینی آب‌وهوای نوین مبتنی بر یادگیری ماشین، آینده‌ای را نوید می‌دهد که در آن ابرکامپیوترها برای پیش‌بینی اختیاری هستند - اما هنوز دوشاخه آن‌ها را از برق نکشید.

دانشگاهیان وابسته به مؤسسه آلن تورینگ در بریتانیا و سایر مؤسسات ادعا می‌کنند که یک مدل پیش‌بینی آب‌وهوا توسعه داده‌اند که می‌تواند روی یک کامپیوتر رومیزی با کسری از هزینه و زمان فعلی که با استفاده از ابرکامپیوترها صرف می‌شود، آموزش داده و اجرا شود.

با تکیه بر کارهای انجام شده در دانشگاه کمبریج، ریچارد ترنر، سرپرست تحقیقات هوش مصنوعی برای پیش‌بینی آب‌وهوا در مؤسسه آلن تورینگ و استاد یادگیری ماشین در دانشگاه کمبریج، و اسکات هاسکینگ، مدیر موقت علم و نوآوری در مؤسسه آلن تورینگ، بر این باورند که نتایج آردوارک به اندازه‌ای خوب است که می‌تواند کل خط لوله پیش‌بینی عددی آب‌وهوا (NWP) را جایگزین کند.

خط لوله NWP از یک فرآیند سه مرحله‌ای پیروی می‌کند. ابتدا، داده‌های مشاهداتی از ماهواره‌ها، بالن‌های هواشناسی، ایستگاه‌های زمینی، کشتی‌ها، هواپیماها و شناورها جمع‌آوری شده و با یک پیش‌بینی اخیر ترکیب می‌شوند تا وضعیت فعلی جو تخمین زده شود. دوم، این تخمین به یک مدل محاسباتی پیچیده داده می‌شود که فیزیک جو را برای تولید پیش‌بینی‌ها شبیه‌سازی می‌کند. در نهایت، آن پیش‌بینی‌های خام پس‌پردازش می‌شوند تا خطاها اصلاح شوند، دقت محلی بهبود یابد و ورودی پیش‌بینی‌کنندگان انسانی لحاظ شود.

کارهای اخیر دیگر در بهبود پیش‌بینی آب‌وهوا با یادگیری ماشین، مانند مدل GenCast گوگل دیپ‌مایند، بر مرحله دوم - مدل محاسباتی - متمرکز شده‌اند، در حالی که گفته می‌شود آردوارک قادر به جایگزینی هر سه مرحله است.

همانطور که در مقاله‌ای که این ماه در مجله علمی Nature منتشر شد، توضیح داده شده است: «آردوارک پیش‌بینی‌های دقیقی را ارائه می‌دهد که تولید آن‌ها به مراتب سریع‌تر از سیستم‌های موجود است، بدون هیچ گونه وابستگی به محصولات NWP در زمان استقرار. تولید یک پیش‌بینی کامل از داده‌های مشاهداتی تقریباً یک ثانیه روی چهار پردازنده گرافیکی NVIDIA A100 طول می‌کشد، در مقایسه با تقریباً ۱۰۰۰ ساعت-گره مورد نیاز HRES برای انجام تنها جذب داده و پیش‌بینی، قبل از در نظر گرفتن مدل‌های محلی پایین‌دستی و پردازش.»

ادعا می‌شود که پیش‌بینی حاصل به اندازه سیستم پیش‌بینی جهانی (GFS) آمریکا دقیق است. با این حال، تنها به حدود یک دهم داده‌های مشاهداتی مورد استفاده در سیستم‌های سنتی NWP متکی است.

ترنر به The Register گفت: «ما فقط از ۱۰ درصد داده‌ها استفاده کردیم زیرا از نظر منابع محاسباتی در آزمایشگاه دانشگاهی من در مقایسه با، مثلاً، شرکت‌های فناوری، بسیار محدود هستیم. با داده‌های بیشتر، انتظار دارم که سیستم بهتر عمل کند. آردوارک قادر است تنها با استفاده از کسری از داده‌ها رقابت کند، تا حدی به این دلیل که مدل‌های هوش مصنوعی مستقیماً برای حل وظیفه مورد نظر (پیش‌بینی) آموزش داده می‌شوند.»

آردوارک هنوز به اصلاحاتی نیاز دارد زیرا هنوز وضوح سیستم پیش‌بینی یکپارچه (IFS) اروپا را ندارد. با این حال، روی این موضوع کار می‌شود و محققان انتظار دارند ماژول‌های تخصصی مختلفی را برای تمرکز بر انواع خاصی از پیش‌بینی‌ها مانند طوفان‌ها، سیل‌ها و سایر رویدادهای شدید آب‌وهوایی اضافه کنند.

آردوارک از سه مؤلفه تشکیل شده است: یک رمزگذار (encoder)، یک پردازشگر (processor) و مجموعه‌ای از ماژول‌های رمزگشا (decoder). رمزگذار حدود ۳۱ میلیون پارامتر دارد و آموزش آن ۱۳ ساعت طول می‌کشد. پردازشگر حاوی حدود ۵۴ میلیون پارامتر است و به هشت ساعت آموزش روی ERA5، یک مجموعه داده آب‌وهوایی، و سپس ۳ ساعت تنظیم دقیق با استفاده از خروجی رمزگذار نیاز دارد. یازده ماژول رمزگشا وجود دارد که هر کدام حدود ۲ میلیون پارامتر دارند و آموزش آن‌ها ۳۰ دقیقه طول می‌کشد. با احتساب دو ساعت دیگر برای تنظیم دقیق سرتاسری، آردوارک را می‌توان در حدود ۱۰۰ ساعت GPU آموزش داد.

پس از انجام این کار، آردوارک می‌تواند در عرض چند دقیقه روی یک کامپیوتر رومیزی پیش‌بینی ایجاد کند. به عنوان نقطه مقایسه، گوگل ادعا می‌کند که مدل GenCast آن می‌تواند یک پیش‌بینی ۱۵ روزه را در هشت دقیقه با استفاده از یک TPU (واحد پردازش تانسور) Google Cloud تولید کند.

کد منبع مرتبط برای تکرار نتایج در مقاله Nature در حال حاضر محدود شده است، اگرچه برنامه این است که در نهایت آردوارک را منتشر کنند.

ترنر گفت: «همه چیز زمانی که نسخه چاپی آردوارک منتشر شود، منبع باز خواهد شد و هر کسی قادر خواهد بود آن را دانلود کرده و سیستم را برای وظایف مورد علاقه خود آموزش دهد.» ®