انویدیا به ساخت کارخانههای هوش مصنوعی سرعت میبخشد
در یک اتاق غارمانند در مکانی نامعلوم در ژاپن، یک انقلاب دیجیتال در حال وقوع است. قفسههای سرور مانند غولها ایستادهاند، قابهای براق آنها با هزاران کابل که با پتانسیل زمزمه میکنند، به هم متصل شدهاند.
تا سال گذشته، این کارخانه هوش مصنوعی گسترده وجود نداشت. اکنون آماده است تا دیدگاه شرکت سافتبانک (SoftBank Corporation) را برای نوآوری مبتنی بر هوش مصنوعی لنگر بیاندازد، دیدگاهی که ریشه در ایجاد جامعهای دارد که با هوش مصنوعی همزیستی دارد و از زیرساختهای پیشرفته برای پیشبرد پیشرفت استفاده میکند.
برای سافتبانک، هر روزی که از استقرار کم میشود، فقط یک برد فنی نیست. بلکه مزایای رقابتی مختلفی را به همراه دارد. در دنیای سریع سوپرکامپیوترهای هوش مصنوعی، سرعت همه چیز است.
سافتبانک، یکی از غولهای فناوری پیشرو در ژاپن، با انویدیا (NVIDIA) برای زنده کردن این سیستم همکاری کرد. آنها با هم، دو مورد از پیشرفتهترین خوشههای محاسباتی در جهان را ساختهاند—خوشههایی که آماده پردازش مقادیر زیادی از دادهها با سرعت بیسابقه و تسریع توسعه مدلهای زبانی بزرگ (Large Language Models یا LLM) هستند که توسط شرکت تابعه سافتبانک، SB Intuitions، توسعه داده میشوند.
با این حال، ایجاد یک کارخانه هوش مصنوعی فقط به معنای وصل کردن سختافزار نیست. این یک تلاش با دقت طراحی شده است که در آن هر کابل، اتصال و قطعه باید کاملاً تراز شوند.
اینجاست که متخصصان زیرساخت انویدیا (NVIDIA Infrastructure Specialists یا NVIS) وارد میشوند. NVIS یک تیم متخصص است که استقرارهای هوش مصنوعی را با دقت و کارایی تسریع میکند. NVIS با استفاده از یک کتاب بازی اثبات شده، مشتریان را قادر میسازد تا فلز برهنه را در زمان بیسابقهای به زیرساخت هوش مصنوعی آماده تولید تبدیل کنند.
سرعت از طریق همکاری
هنگامی که سافتبانک یک جدول زمانی تسریعشده را درخواست کرد، انویدیا آماده بود تا به تبدیل یک هدف بلندپروازانه به واقعیت کمک کند. با وجود تجربه محدود سافتبانک با پلتفرمهای هوش مصنوعی در مقیاس بزرگ، چابکی آن—همراه با تخصص و معماری مرجع انویدیا—موفقیت را تضمین کرد.
استقرار NVIDIA DGX SuperPOD سافتبانک با دقت تنظیم شده بود. هر مرحله به نقاط عطف و جدولهای زمانی نگاشت شده بود و پروژه به دو خوشه تقسیم شد تا به مدیریت سرعت کمک کند.
هنگامی که سافتبانک درخواست کرد که 10 روز قبل از تاریخ برنامهریزیشده اولیه عملیات به پایان برسد، NVIS برای رسیدن به مهلت جدید دوباره تنظیم شد. این نوع پاسخ چابک نیازمند مدیریت دقیق منابع، تدارکات دقیق و هماهنگی روزانه بود.
اعداد داستان را میگویند. هزاران کابل و صدها سوئیچ شبکه، 510 سیستم NVIDIA DGX B200 را به هم متصل کردند، گرههای محاسباتی قدرتمندی که در قلب یک DGX SuperPOD قرار دارند. هر دو خوشه عملکرد استثنایی FP64 را ارائه کردند: یکی به 89.78 گیگافلاپ و دیگری به 91.94 گیگافلاپ رسید، معیاری از توانایی آنها در پردازش مقادیر زیادی از دادهها در هر ثانیه.
هیرونوبو تامبا (Hironobu Tamba)، معاون رئیس استراتژی پلتفرم داده و رئیس بخش واحد فناوری در سافتبانک، گفت: «دقت و سرعت استقرار 510 سیستم NVIDIA DGX در این خوشههای DGX SuperPOD نشان میدهد که وقتی تخصص و همکاری همسو میشوند، چه چیزی ممکن است. این زیرساخت فقط سریع نیست—بلکه در حال تعیین یک استاندارد جدید برای توسعه هوش مصنوعی در ژاپن است.»
سافتبانک با داشتن بزرگترین زیرساخت محاسبات هوش مصنوعی در ژاپن، اکنون به عنوان یک رهبر در اکوسیستم هوش مصنوعی این کشور در موقعیت خوبی قرار دارد.
غلبه بر چالشها با دقت و چابکی
البته، هیچ پروژهای در این مقیاس بدون سهم خود از موانع آشکار نمیشود. در مورد شرکت سافتبانک (SoftBank Corp.)، دسترسی محدود به برق مستلزم آن بود که NVIS برخی از آزمایشها را در ساعات غیر کاری انجام دهد. هنگامی که به دلیل اجزای شبکه، مشکلات اتصال به وجود آمد، تیم یک راه حل خلاقانه پیدا کرد و قطعات خوشه دوم را برای حفظ برنامه زمانی خوشه اول تغییر کاربری داد.
تیمهای انویدیا (NVIDIA) به طور دقیق هر چالش را در زمان واقعی ردیابی و حل کردند و اطمینان حاصل کردند که استقرار طبق برنامه باقی میماند.
یکی از اعضای تیم گفت: «این فقط یک شغل نبود. بیشتر شبیه یک خدمه پیت استاپ فرمول 1 بود، که به طور هماهنگ کار میکردیم، هر یک از ما میدانستیم که هر روزی که پسانداز میکنیم، ارزش بیشتری برای سافتبانک دارد.»
پیشگامی در آینده هوش مصنوعی ژاپن
استقرار سافتبانک (SoftBank’s deployment) چیزی بیش از یک دستاورد فنی است. این گامی به سوی ساخت زیرساخت اجتماعی نسل بعدی است که برای تسریع پروژههای داخلی مانند توسعه LLM و فعال کردن اکوسیستم گستردهتری از توسعهدهندگان هوش مصنوعی مولد در سراسر ژاپن حیاتی است.
هنگامی که این پلتفرم عملیاتی شود، به شرکتهای خارجی نیز خدمات ارائه میدهد و به توسعه قابلیتهای هوش مصنوعی داخلی ژاپن کمک میکند.
تامبا (Tamba) گفت: «کارخانه هوش مصنوعی شرکت سافتبانک (SoftBank Corp.) یک جهش رو به جلو برای ژاپن است، نوآوری را تسریع میکند و اکوسیستم هوش مصنوعی این کشور را برای پیشرفت توانمند میسازد.»
کتاب بازی NVIS: سرعت، دقت و همکاری
استقرار سافتبانک (SoftBank’s deployment) کتاب بازی NVIS را به نمایش میگذارد، رویکردی ساده برای مدیریت پروژههای هوش مصنوعی در مقیاس بزرگ به سرعت و با دقت. با NVIS، انویدیا (NVIDIA) میتواند روزانه هزاران GPU را نصب کند و مراکز هوش مصنوعی عظیم را به کارخانههای هوش مصنوعی کارآمد تبدیل کند.
در قلب DGX SuperPOD سافتبانک، پلتفرم شبکهسازی NVIDIA Quantum-2 InfiniBand قرار دارد که برای رسیدگی به بارهای داده عظیم بدون گلوگاه طراحی شده است. این فناوری شبکهسازی، همراه با قابلیتهای دوقلوی دیجیتال NVIDIA Air، یک ماکت مجازی از مرکز داده که امکان آزمایش و اعتبارسنجی قبل از استقرار را فراهم میکند، تضمین کرد که این پروژه از برنامهریزی تا اجرا به آرامی پیش میرود.
ریاضیات مدیرعامل: چرا سرعت مهم است
برای شرکتهایی که فناوری انویدیا (NVIDIA) را اتخاذ میکنند، سرعت فقط فنی نیست، بلکه استراتژیک است. هرچه کارخانه هوش مصنوعی جدید آن سریعتر به بهرهبرداری برسد، سریعتر میتواند بینشهایی به دست آورد، عملیات را ساده کند و محصولات جدید مبتنی بر هوش مصنوعی را راهاندازی کند.
تجزیه و تحلیل داخلی انویدیا (NVIDIA) نشان میدهد که اگر زمان نصب از 6+ ماه معمول به فقط سه هفته تسریع شود، مشتریان میتوانند از هزینههایی تا سقف 150 میلیون دلار مرتبط با توقف طولانیمدت استقرار برای سیستمهای بزرگ هوش مصنوعی جلوگیری کنند. این تخمین بر اساس هزینههای عملیاتی یک استقرار در مقیاس بزرگ است که انویدیا (NVIDIA) تقریباً 1 میلیون دلار در روز برای یک مرکز داده 1K سروری با 8K GPU محاسبه میکند.
استقرار سریعتر همچنین مشتریان را قادر میسازد تا با اجرای حجمهای کاری مانند LLM بدون تأخیر، زودتر درآمدزایی کنند. هر روز اضافی از عملیات که توسط NVIS باز میشود، به معنای اجتناب از 1 میلیون دلار هزینه و جذب فرصتهای درآمدی است که در غیر این صورت به دلیل خرابی از دست میروند.
سریعتر با DGX SuperPOD بسازید
استقرار DGX SuperPOD خود را با متخصصان زیرساخت انویدیا (NVIDIA Infrastructure Specialists یا NVIS) تسریع کنید و زمان خود را برای اولین آموزش به کسری از حالت عادی کاهش دهید. برای اطلاعات بیشتر، به خدمات زیرساخت هوش مصنوعی | NVIDIA NVIS مراجعه کنید.