نگاهی به آینده: جنسن هوانگ، مدیرعامل انویدیا، در کنفرانس فناوری پردازندههای گرافیکی سال 2025 این شرکت، از مجموعهای قوی از پردازندههای گرافیکی شتابدهنده هوش مصنوعی، از جمله Blackwell Ultra B300، Vera Rubin و Rubin Ultra رونمایی کرد. این پردازندههای گرافیکی برای افزایش عملکرد هوش مصنوعی، بهویژه در وظایف استنتاج و آموزش طراحی شدهاند.
Blackwell Ultra B300، که قرار است در نیمه دوم سال 2025 عرضه شود، ظرفیت حافظه را از 192 گیگابایت به 288 گیگابایت HBM3e افزایش میدهد و در مقایسه با Blackwell GB200، 50 درصد افزایش در محاسبات تانسور FP4 متراکم ارائه میدهد.
این پیشرفتها از مدلهای بزرگتر هوش مصنوعی پشتیبانی میکنند و عملکرد استنتاج را برای چارچوبهایی مانند DeepSeek R1 بهبود میبخشند. در یک پیکربندی کامل رک NVL72، Blackwell Ultra 1.1 اگزافلاپس محاسبات استنتاج FP4 متراکم ارائه میدهد که جهشی قابل توجه نسبت به تنظیمات فعلی Blackwell B200 است.
Blackwell Ultra B300 فقط یک پردازنده گرافیکی مستقل نیست. در کنار واحد اصلی B300، انویدیا راهحلهای جدید رک سرور B300 NVL16، ایستگاه GB300 DGX و سیستم رک کامل GB300 NV72L را معرفی میکند.
ترکیب هشت رک NV72L، یک SuperPOD کامل Blackwell Ultra DGX (تصویر بالا) را تشکیل میدهد که دارای 288 پردازنده Grace، 576 پردازنده گرافیکی Blackwell Ultra، 300 ترابایت حافظه HBM3e و 11.5 اگزافلاپس چشمگیر قدرت محاسباتی FP4 است. این سیستمها را میتوان به هم متصل کرد تا ابررایانههای بزرگ مقیاسی ایجاد کرد که انویدیا آنها را «کارخانههای هوش مصنوعی» مینامد.
انتظار میرود پردازندههای گرافیکی نسل بعدی Vera Rubin که در ابتدا در Computex 2024 معرفی شدند، در نیمه دوم سال 2026 عرضه شوند و بهبودهای قابل توجهی در عملکرد، بهویژه در آموزش و استنتاج هوش مصنوعی ارائه دهند.
Vera Rubin دارای دهها ترابایت حافظه است و با یک پردازنده سفارشی طراحی شده توسط انویدیا، Vera، که شامل 88 هسته Arm سفارشی با 176 رشته است، جفت شده است.
این پردازنده گرافیکی دو تراشه را روی یک دای ادغام میکند و به عملکرد استنتاج 50 پتافلاپس FP4 در هر تراشه دست مییابد. در یک تنظیم رک کامل NVL144، Vera Rubin میتواند 3.6 اگزافلاپس محاسبات استنتاج FP4 ارائه دهد.
Rubin Ultra با تکیه بر معماری Vera Rubin، قرار است در نیمه دوم سال 2027 عرضه شود. از پیکربندی رک NVL576 استفاده میکند و هر پردازنده گرافیکی دارای چهار دای با اندازه رتیکل است که 100 پتافلاپس دقت FP4 در هر تراشه ارائه میدهد.
Rubin Ultra وعده 15 اگزافلاپس محاسبات استنتاج FP4 و 5 اگزافلاپس عملکرد آموزش FP8 را میدهد که به طور قابل توجهی از قابلیتهای Vera Rubin فراتر میرود. هر پردازنده گرافیکی Rubin Ultra شامل 1 ترابایت حافظه HBM4e خواهد بود که به 365 ترابایت حافظه سریع در کل رک کمک میکند.
انویدیا همچنین یک معماری پردازنده گرافیکی نسل بعدی به نام "Feynman" را معرفی کرد که انتظار میرود در سال 2028 در کنار پردازنده Vera عرضه شود. در حالی که جزئیات کمی در دست است، انتظار میرود Feynman قابلیتهای محاسباتی هوش مصنوعی انویدیا را بیشتر پیش ببرد.
هوانگ در سخنرانی اصلی خود، دیدگاه بلندپروازانه انویدیا برای هوش مصنوعی را تشریح کرد و مراکز داده را "کارخانههای هوش مصنوعی" توصیف کرد که توکنهای پردازش شده توسط مدلهای هوش مصنوعی را تولید میکنند. او همچنین بر پتانسیل "هوش مصنوعی فیزیکی" برای تامین انرژی رباتهای انساننما تاکید کرد و از پلتفرمهای نرمافزاری انویدیا برای آموزش مدلهای هوش مصنوعی در محیطهای مجازی برای کاربردهای دنیای واقعی استفاده کرد.
نقشه راه انویدیا خوشحال است که این پردازندههای گرافیکی را به عنوان محور اصلی آینده محاسبات قرار دهد و بر نیاز به افزایش قدرت محاسباتی برای همگام شدن با پیشرفتهای هوش مصنوعی تاکید میکند. این استراتژی در حالی مطرح میشود که انویدیا قصد دارد پس از نوسانات اخیر بازار، با تکیه بر موفقیت تراشههای Blackwell خود، سرمایهگذاران را مطمئن کند.