تصویری از یک مرکز داده سافت‌بانک
تصویری از یک مرکز داده سافت‌بانک

انویدیا به ساخت کارخانه‌های هوش مصنوعی با NVIDIA DGX SuperPOD سرعت می‌بخشد

انویدیا به ساخت کارخانه‌های هوش مصنوعی سرعت می‌بخشد

در یک اتاق غارمانند در مکانی نامعلوم در ژاپن، یک انقلاب دیجیتال در حال وقوع است. قفسه‌های سرور مانند غول‌ها ایستاده‌اند، قاب‌های براق آن‌ها با هزاران کابل که با پتانسیل زمزمه می‌کنند، به هم متصل شده‌اند.

تا سال گذشته، این کارخانه هوش مصنوعی گسترده وجود نداشت. اکنون آماده است تا دیدگاه شرکت سافت‌بانک (SoftBank Corporation) را برای نوآوری مبتنی بر هوش مصنوعی لنگر بیاندازد، دیدگاهی که ریشه در ایجاد جامعه‌ای دارد که با هوش مصنوعی همزیستی دارد و از زیرساخت‌های پیشرفته برای پیشبرد پیشرفت استفاده می‌کند.

برای سافت‌بانک، هر روزی که از استقرار کم می‌شود، فقط یک برد فنی نیست. بلکه مزایای رقابتی مختلفی را به همراه دارد. در دنیای سریع سوپرکامپیوترهای هوش مصنوعی، سرعت همه چیز است.

سافت‌بانک، یکی از غول‌های فناوری پیشرو در ژاپن، با انویدیا (NVIDIA) برای زنده کردن این سیستم همکاری کرد. آن‌ها با هم، دو مورد از پیشرفته‌ترین خوشه‌های محاسباتی در جهان را ساخته‌اند—خوشه‌هایی که آماده پردازش مقادیر زیادی از داده‌ها با سرعت بی‌سابقه و تسریع توسعه مدل‌های زبانی بزرگ (Large Language Models یا LLM) هستند که توسط شرکت تابعه سافت‌بانک، SB Intuitions، توسعه داده می‌شوند.

با این حال، ایجاد یک کارخانه هوش مصنوعی فقط به معنای وصل کردن سخت‌افزار نیست. این یک تلاش با دقت طراحی شده است که در آن هر کابل، اتصال و قطعه باید کاملاً تراز شوند.

اینجاست که متخصصان زیرساخت انویدیا (NVIDIA Infrastructure Specialists یا NVIS) وارد می‌شوند. NVIS یک تیم متخصص است که استقرارهای هوش مصنوعی را با دقت و کارایی تسریع می‌کند. NVIS با استفاده از یک کتاب بازی اثبات شده، مشتریان را قادر می‌سازد تا فلز برهنه را در زمان بی‌سابقه‌ای به زیرساخت هوش مصنوعی آماده تولید تبدیل کنند.

سرعت از طریق همکاری

هنگامی که سافت‌بانک یک جدول زمانی تسریع‌شده را درخواست کرد، انویدیا آماده بود تا به تبدیل یک هدف بلندپروازانه به واقعیت کمک کند. با وجود تجربه محدود سافت‌بانک با پلتفرم‌های هوش مصنوعی در مقیاس بزرگ، چابکی آن—همراه با تخصص و معماری مرجع انویدیا—موفقیت را تضمین کرد.

استقرار NVIDIA DGX SuperPOD سافت‌بانک با دقت تنظیم شده بود. هر مرحله به نقاط عطف و جدول‌های زمانی نگاشت شده بود و پروژه به دو خوشه تقسیم شد تا به مدیریت سرعت کمک کند.

هنگامی که سافت‌بانک درخواست کرد که 10 روز قبل از تاریخ برنامه‌ریزی‌شده اولیه عملیات به پایان برسد، NVIS برای رسیدن به مهلت جدید دوباره تنظیم شد. این نوع پاسخ چابک نیازمند مدیریت دقیق منابع، تدارکات دقیق و هماهنگی روزانه بود.

اعداد داستان را می‌گویند. هزاران کابل و صدها سوئیچ شبکه، 510 سیستم NVIDIA DGX B200 را به هم متصل کردند، گره‌های محاسباتی قدرتمندی که در قلب یک DGX SuperPOD قرار دارند. هر دو خوشه عملکرد استثنایی FP64 را ارائه کردند: یکی به 89.78 گیگافلاپ و دیگری به 91.94 گیگافلاپ رسید، معیاری از توانایی آن‌ها در پردازش مقادیر زیادی از داده‌ها در هر ثانیه.

هیرونوبو تامبا (Hironobu Tamba)، معاون رئیس استراتژی پلتفرم داده و رئیس بخش واحد فناوری در سافت‌بانک، گفت: «دقت و سرعت استقرار 510 سیستم NVIDIA DGX در این خوشه‌های DGX SuperPOD نشان می‌دهد که وقتی تخصص و همکاری همسو می‌شوند، چه چیزی ممکن است. این زیرساخت فقط سریع نیست—بلکه در حال تعیین یک استاندارد جدید برای توسعه هوش مصنوعی در ژاپن است.»

سافت‌بانک با داشتن بزرگترین زیرساخت محاسبات هوش مصنوعی در ژاپن، اکنون به عنوان یک رهبر در اکوسیستم هوش مصنوعی این کشور در موقعیت خوبی قرار دارد.

غلبه بر چالش‌ها با دقت و چابکی

البته، هیچ پروژه‌ای در این مقیاس بدون سهم خود از موانع آشکار نمی‌شود. در مورد شرکت سافت‌بانک (SoftBank Corp.)، دسترسی محدود به برق مستلزم آن بود که NVIS برخی از آزمایش‌ها را در ساعات غیر کاری انجام دهد. هنگامی که به دلیل اجزای شبکه، مشکلات اتصال به وجود آمد، تیم یک راه حل خلاقانه پیدا کرد و قطعات خوشه دوم را برای حفظ برنامه زمانی خوشه اول تغییر کاربری داد.

تیم‌های انویدیا (NVIDIA) به طور دقیق هر چالش را در زمان واقعی ردیابی و حل کردند و اطمینان حاصل کردند که استقرار طبق برنامه باقی می‌ماند.

یکی از اعضای تیم گفت: «این فقط یک شغل نبود. بیشتر شبیه یک خدمه پیت استاپ فرمول 1 بود، که به طور هماهنگ کار می‌کردیم، هر یک از ما می‌دانستیم که هر روزی که پس‌انداز می‌کنیم، ارزش بیشتری برای سافت‌بانک دارد.»

پیشگامی در آینده هوش مصنوعی ژاپن

استقرار سافت‌بانک (SoftBank’s deployment) چیزی بیش از یک دستاورد فنی است. این گامی به سوی ساخت زیرساخت اجتماعی نسل بعدی است که برای تسریع پروژه‌های داخلی مانند توسعه LLM و فعال کردن اکوسیستم گسترده‌تری از توسعه‌دهندگان هوش مصنوعی مولد در سراسر ژاپن حیاتی است.

هنگامی که این پلتفرم عملیاتی شود، به شرکت‌های خارجی نیز خدمات ارائه می‌دهد و به توسعه قابلیت‌های هوش مصنوعی داخلی ژاپن کمک می‌کند.

تامبا (Tamba) گفت: «کارخانه هوش مصنوعی شرکت سافت‌بانک (SoftBank Corp.) یک جهش رو به جلو برای ژاپن است، نوآوری را تسریع می‌کند و اکوسیستم هوش مصنوعی این کشور را برای پیشرفت توانمند می‌سازد.»

کتاب بازی NVIS: سرعت، دقت و همکاری

استقرار سافت‌بانک (SoftBank’s deployment) کتاب بازی NVIS را به نمایش می‌گذارد، رویکردی ساده برای مدیریت پروژه‌های هوش مصنوعی در مقیاس بزرگ به سرعت و با دقت. با NVIS، انویدیا (NVIDIA) می‌تواند روزانه هزاران GPU را نصب کند و مراکز هوش مصنوعی عظیم را به کارخانه‌های هوش مصنوعی کارآمد تبدیل کند.

در قلب DGX SuperPOD سافت‌بانک، پلتفرم شبکه‌سازی NVIDIA Quantum-2 InfiniBand قرار دارد که برای رسیدگی به بارهای داده عظیم بدون گلوگاه طراحی شده است. این فناوری شبکه‌سازی، همراه با قابلیت‌های دوقلوی دیجیتال NVIDIA Air، یک ماکت مجازی از مرکز داده که امکان آزمایش و اعتبارسنجی قبل از استقرار را فراهم می‌کند، تضمین کرد که این پروژه از برنامه‌ریزی تا اجرا به آرامی پیش می‌رود.

ریاضیات مدیرعامل: چرا سرعت مهم است

برای شرکت‌هایی که فناوری انویدیا (NVIDIA) را اتخاذ می‌کنند، سرعت فقط فنی نیست، بلکه استراتژیک است. هرچه کارخانه هوش مصنوعی جدید آن سریع‌تر به بهره‌برداری برسد، سریع‌تر می‌تواند بینش‌هایی به دست آورد، عملیات را ساده کند و محصولات جدید مبتنی بر هوش مصنوعی را راه‌اندازی کند.

تجزیه و تحلیل داخلی انویدیا (NVIDIA) نشان می‌دهد که اگر زمان نصب از 6+ ماه معمول به ​​فقط سه هفته تسریع شود، مشتریان می‌توانند از هزینه‌هایی تا سقف 150 میلیون دلار مرتبط با توقف طولانی‌مدت استقرار برای سیستم‌های بزرگ هوش مصنوعی جلوگیری کنند. این تخمین بر اساس هزینه‌های عملیاتی یک استقرار در مقیاس بزرگ است که انویدیا (NVIDIA) تقریباً 1 میلیون دلار در روز برای یک مرکز داده 1K سروری با 8K GPU محاسبه می‌کند.

استقرار سریع‌تر همچنین مشتریان را قادر می‌سازد تا با اجرای حجم‌های کاری مانند LLM بدون تأخیر، زودتر درآمدزایی کنند. هر روز اضافی از عملیات که توسط NVIS باز می‌شود، به معنای اجتناب از 1 میلیون دلار هزینه و جذب فرصت‌های درآمدی است که در غیر این صورت به دلیل خرابی از دست می‌روند.

سریع‌تر با DGX SuperPOD بسازید

استقرار DGX SuperPOD خود را با متخصصان زیرساخت انویدیا (NVIDIA Infrastructure Specialists یا NVIS) تسریع کنید و زمان خود را برای اولین آموزش به کسری از حالت عادی کاهش دهید. برای اطلاعات بیشتر، به خدمات زیرساخت هوش مصنوعی | NVIDIA NVIS مراجعه کنید.