این پست توسط MinIO حمایت شده است.
اگر اخبار فناوری را دنبال میکنید، احتمالاً مطالب زیادی درباره NVIDIA و واحدهای پردازش گرافیکی (GPU) آن خواندهاید. با این حال، این نتیجهگیری که NVIDIA فقط بر روی GPUها متمرکز است، نادرست خواهد بود. بزرگترین کشف من از کنفرانس GTC 2025 NVIDIA در ماه گذشته این بود که NVIDIA در زمینههای محاسبات، شبکهسازی و ذخیرهسازی نوآوری میکند. بیشتر این نوآوریها در مورد هوش مصنوعی (Artificial Intelligence) هستند، اما گیمرها نباید نگران باشند؛ یک تراشه RTX جدید برای شما وجود دارد.
اعلامیههای جدید و فناوریهای کلیدی که در سخنرانی اصلی جنسن هوانگ، مدیرعامل NVIDIA، مورد توجه قرار گرفتند، نشان میدهند که NVIDIA در زمینههای محاسبات، شبکهسازی، ذخیرهسازی و مشارکتهای خود چه کاری انجام میدهد. NVIDIA همچنین یک پیشنهاد برای متخصصان هوش مصنوعی در تمام ابعاد میخواهد: مهندسانی که آزمایشهایی را روی رایانههای رومیزی خود انجام میدهند؛ شرکتهایی که زیرساخت هوش مصنوعی را اجرا میکنند، که NVIDIA آن را فرصتی ۵۰۰ میلیارد دلاری میبیند؛ هایپراسکیلرهایی که به تجهیزات تخصصی شبکهسازی مبتنی بر فوتونیک نیاز دارند؛ و در نهایت، سازمانهایی که مرزهای هوش مصنوعی فیزیکی را با رباتیک جابجا میکنند.
بیایید با محاسبات شروع کنیم، زیرا این همان چیزی است که NVIDIA را با اولین GPUهای بازی خود روی نقشه قرار داد.
محاسبات
1. GeForce RTX 5090
GeForce RTX 5090، GPU رومیزی رده بالا جدید برای گیمرها و متخصصان خلاق خواهد بود. (آیا میدانستید که RTX مخفف Ray Tracing Texel Extreme است؟ این تکنیکی است که در بازیها برای شبیهسازی نورپردازی و سایههای واقعی استفاده میشود.) گیمرها از تاخیر بهبود یافته ردیابی پرتو بهرهمند خواهند شد. این تراشه بر اساس معماری NVIDIA Blackwell ساخته شده است و دارای ۳۲ گیگابایت حافظه پرسرعت Graphics Double Data Rate 7 (GDDR7) و ۳.۴ پتافلاپس FP4 compute است. در مقایسه با RTX 4090، ۳۰٪ کوچکتر است و ۳۰٪ بهتر در دفع گرما عمل میکند. خبر بد این است که این GPU برچسب قیمت 1,999 دلاری دارد. اگر شما یک مهندس هوش مصنوعی/یادگیری ماشین (ML) هستید، ممکن است وسوسه شوید که از آن برای آزمایشها و حجمهای کاری هوش مصنوعی استفاده کنید، اما قبل از انجام این کار، درباره DGX Spark (در زیر) بخوانید.
2. CUDA-X
NVIDIA CUDA-X یک اعلامیه جدید نیست. این تلاش برای مدتی در حال انجام بوده است. CUDA-X مجموعهای از کتابخانههای بهینه شده است که بر روی CUDA ساخته شدهاند تا هوش مصنوعی، محاسبات با کارایی بالا (HPC) و حجمهای کاری علم داده را تسریع کنند. این کتابخانهها به منظور کمک به توسعهدهندگان برای استفاده کامل از GPUهای NVIDIA برای طیف گستردهای از برنامهها بدون نیاز به نوشتن کد GPU سطح پایین طراحی شدهاند. بسیاری از این کتابخانهها جایگزینهای فوری برای کتابخانههای موجود هستند که روی CPU اجرا میشوند. برای مثال، کتابخانه cuDF میتواند برای جایگزینی Pandas و Polars با صفر تغییر کد استفاده شود. در اینجا لیست کاملی از کتابخانههای ارائه شده وجود دارد:
- cuPyNumeric: محاسبات عددی (جایگزین Numpy)
- cuDF و cuML: علم داده و پردازش (جایگزین Pandas)
- cuEquivariance و cuTensor: شیمی کوانتومی
- cuLitho: لیتوگرافی محاسباتی
- Earth-2: تحلیل آب و هوا
- Aerial Sionna: پردازش سیگنال 5G/6G
- cuOpt: بهینهسازی تصمیمگیری
- Parabricks: توالییابی ژن
- Monai: تصویربرداری پزشکی
- cuQuantim و Cuda-Q: شبیهسازیهای محاسبات کوانتومی
- TRT-LLM، Megatron، NCCL، cuDDN، Cutlass و cuBlas: یادگیری عمیق
- cuDSS، cuSparse، cuFFT و AMGX: مهندسی به کمک کامپیوتر
- Warp: فیزیک
3. DGX Spark
DGX Spark انویدیا، که قبلاً به عنوان پروژه DIGITS در نمایشگاه CES 2025 در ژانویه معرفی شد، یک کامپیوتر رومیزی است که برای ارائه قدرت محاسباتی فراتر از سیستمهای بازی طراحی شده است. DGX Spark برای توسعهدهندگان هوش مصنوعی، محققان و دانشمندان داده که نیاز به نمونهسازی، تنظیم دقیق و استقرار مدلهای بزرگ هوش مصنوعی به صورت محلی دارند، بدون تکیه صرفاً بر منابع ابری یا مرکز داده، طراحی شده است. مشخصات:
- تراشه: GB10 Grace Blackwell Superchip، که دارای یک GPU مبتنی بر معماری Blackwell و یک پردازنده Grace 20-core Arm است.
- عملکرد: 1 پتافلاپس در FP4
- حافظه: 128 گیگابایت حافظه یکپارچه
- شبکهسازی: ConnectX-7 Smart NIC
- ذخیرهسازی: پشتیبانی از حداکثر 4 ترابایت حافظه NVMe SSD
- پشته نرمافزاری NVIDIA AI از پیش نصب شده
ایسوس مدلی به نام ایسوس اسنت GX10 با 1 ترابایت فضای ذخیرهسازی به قیمت 2,999 دلار ارائه خواهد کرد. اگر فضای ذخیرهسازی بیشتری میخواهید، میتوانید مستقیماً از NVIDIA خرید کنید و DGX Spark با 4 ترابایت فضای ذخیرهسازی را به قیمت 3,999 دلار دریافت کنید. در نهایت، اگر میخواهید یک کارخانه کوچک هوش مصنوعی بسازید، میتوانید دو DGX Spark را از NVIDIA با یک کابل اتصال به قیمت 8,049 دلار بخرید.
4. ایستگاه DGX
DGX Station نیز یک کامپیوتر رومیزی برای متخصصان هوش مصنوعی است. بسیار قدرتمندتر از DGX Spark خواهد بود و فقط از طریق شرکا در دسترس خواهد بود. NVIDIA نسخه خود از این کامپیوتر رومیزی را نخواهد ساخت. اطلاعات قیمت در دسترس نیست. با این حال، مشخصات اولیه آن نشان میدهد که پرهزینه خواهد بود. در اینجا مشخصاتی که NVIDIA تا به امروز منتشر کرده است، آمده است:
- تراشه: NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip، که دارای یک GPU Blackwell Ultra و یک پردازنده Grace-72 Core Neoverse V2 است.
- عملکرد: 20 پتافلاپس در FP4
- حافظه GPU: حداکثر 288 گیگابایت HBM3e (8 ترابایت بر ثانیه)
- حافظه CPU: حداکثر 496 گیگابایت LPDDR5X (حداکثر 396 گیگابایت بر ثانیه)
- NVLink-C2C: حداکثر 900 گیگابایت بر ثانیه
- شبکهسازی: ConnectX-8 SuperNIC (حداکثر 800 گیگابایت بر ثانیه)
- پشته نرمافزاری NVIDIA AI از پیش نصب شده
5. معماری GPU دیوید بلکول
GPU بلکول در حال تولید کامل است و سفارشها از چهار ارائهدهنده برتر خدمات ابری (اوراکل، گوگل، مایکروسافت و AWS) قبلاً از اوج سال فروش GPUهای هاپر فراتر رفته است. در سال 2024، NVIDIA 1.3 میلیون GPU هاپر فروخت و تا کنون در سال 2025، 3.6 میلیون سفارش برای بلکول وجود دارد. علاوه بر این، GB200 NVL72 در حال اجرای Dynamo 40 برابر بهتر از هاپر برای استنتاج خواهد بود.
6. معماری GPU ورا روبین
نسل بعدی GPUهای مرکز داده مبتنی بر معماری روبین خواهد بود که به نام ورا روبین (Vera Rubin)، ستارهشناس آمریکایی که ماده تاریک را کشف کرد، نامگذاری شده است. وعده داده شده است که 2.5 برابر سریعتر از نسل قبلی خود خواهد بود. این تراشه با 288 گیگابایت حافظه HDM4 عرضه خواهد شد.
شبکهسازی GPUها
7. بلکول GB200 NVL72
بلکول GB200 NVL72 در حال حاضر در دسترس است. این تراشه 36 پردازنده Grace و 72 GPU بلکول را در یک رک واحد متصل میکند. این به این 72 GPU اجازه میدهد تا به عنوان یک GPU غولپیکر واحد عمل کنند - چیزی که NVIDIA آن را مقیاسبندی نهایی مینامد. چنین سیستمی قادر به میزبانی مدلهای زبانی بزرگ (LLM) تریلیون پارامتری است.
8. بلکول اولترا GB300 NVL72
بلکول اولترا NVL72 در نیمه دوم سال 2025 در دسترس خواهد بود. وعده داده شده است که 1.5 برابر عملکرد GB200 NVL72 را ارائه دهد. همچنین بهبودهایی در مجموعه دستورالعملها برای LLMها (دستورالعملهای توجه) وجود دارد و 1.5 برابر حافظه بیشتر وجود دارد.
9. ورا روبین NVL144
پیکربندی رک ورا روبین در نیمه دوم سال 2026 در دسترس خواهد بود. این پیکربندی 88 پردازنده ورا را با استفاده از NVLink-C2C و 144 GPU روبین را با استفاده از NVLink6 متصل میکند. تقریباً همه چیز در این طراحی جدید است به جز شاسی، که ارتقاء را آسانتر میکند.
10. ورا روبین اولترا NVL576
ورا روبین اولترا باید در نیمه دوم سال 2027 در دسترس باشد. پردازندهها یکسان خواهند بود، اما این رک حاوی 576 GPU روبین اولترا متصل شده با استفاده از NVLink7 خواهد بود. وعده داده شده است که 14 برابر سریعتر از GB300 NVL72 باشد.
11. NVIDIA Dynamo
بهترین راه برای میزبانی یک LLM تریلیون پارامتری، توزیع آن در چندین GPU متصل به هم با استفاده از NVL72 است. NVIDIA به این تکنیک، سرویسدهی جدا شده میگوید. با این حال، اگر یک LLM را در بین GPUها تقسیم کنید، نمیخواهید آن را به طور تصادفی انجام دهید. در عوض، میخواهید LLM را به گونهای تقسیم کنید که ارتباطات درون فرآیندی را به حداقل برساند. همچنین میخواهید بتوانید هر بخش از LLM را به طور جداگانه مقیاسبندی کنید. (همان روشی که میتوانید خدمات مختلف را در یک برنامه به طور جداگانه با استفاده از معماری میکروسرویسها مقیاسبندی کنید.)
برای رفع چالشهای استنتاج توزیع شده و جدا شده، NVIDIA Dynamo را ایجاد کرد، یک چارچوب استنتاج متنباز. این چارچوب قابلیتهای زیر را ارائه میدهد:
- برنامهریز منابع GPU: یک موتور برنامهریزی و زمانبندی که ظرفیت و فعالیت پیشپر کردن را در استقرارهای چند گرهای نظارت میکند تا منابع GPU را تنظیم کند و آنها را در بین پیشپر کردن و رمزگشایی تخصیص دهد.
- روتر هوشمند: یک موتور مسیریابی آگاه از حافظه پنهان (KV) که به طور موثر ترافیک ورودی را در ناوگان بزرگ GPU در استقرارهای چند گرهای هدایت میکند تا محاسبات مجدد پرهزینه را به حداقل برساند.
- کتابخانه ارتباطی کم تاخیر: کتابخانه انتقال داده استنتاج پیشرفته که انتقال حافظه پنهان KV بین GPUها و در بین انواع حافظه و ذخیرهسازی ناهمگن را تسریع میکند.
- مدیر حافظه پنهان KV: یک موتور تخلیه حافظه پنهان KV آگاه از هزینه که حافظه پنهان KV را در سلسله مراتب مختلف حافظه انتقال میدهد و حافظه GPU با ارزش را آزاد میکند و در عین حال تجربه کاربری را حفظ میکند.
12. Spectrum-X
Spectrum-X نشاندهنده داستان مقیاسبندی NVIDIA است. بسیاری از مردم از ورود NVIDIA به دنیای اترنت (Ethernet) شگفتزده شدند، اما این شرکت میخواست به اترنت کمک کند تا بیشتر شبیه InfiniBand شود. (InfiniBand معمولاً برای محاسبات با کارایی بالا استفاده میشود، در حالی که اترنت برای شبکهسازی همهمنظوره، مانند اتصال دستگاهها، بهترین است.) بنابراین، این شرکت در Spectrum-X سرمایهگذاری کرد، که از یک Spectrum-X SuperNIC و یک سوئیچ اترنت Spectrum-X تشکیل شده است و به آن قابلیتهایی را داد که InfiniBand دارد.
ذخیرهسازی
13. ذخیرهسازی با سرعت بالا
تمام این محاسبات و شبکهسازی با سرعت بالا نیازمند ذخیرهسازی با سرعت بالا برای تامین انرژی آن است. با در نظر گرفتن این هدف، MinIO با NVIDIA همکاری کرده است تا NVIDIA GPUDirect Storage، NVIDIA BlueField-3، NVIDIA NIM و اپراتور GPU NVIDIA را با AIStor ادغام کند. این ویژگیها و ادغامهای جدید برای مشتریان بتا AIStor MinIO تحت پیشنمایش خصوصی باز است.
PromptObject AIStor نحوه تعامل کاربران با اشیاء ذخیره شده را با اجازه دادن به آنها برای پرسیدن سؤال در مورد محتوای دادههای خود و استخراج اطلاعات با استفاده از زبان طبیعی، بدون نیاز به نوشتن پرس و جوهای پیچیده یا کد، تغییر میدهد. اپراتور GPU NVIDIA بر روی چارچوب اپراتور Kubernetes ساخته شده است و یک راه حل اتوماسیون جامع برای مدیریت GPU ارائه میدهد. ادغام AIStor با اپراتور GPU NVIDIA به سازمانها این امکان را میدهد تا به راحتی یک خوشه مبتنی بر GPU را برای استفاده با API PromptObject AIStor راهاندازی کنند.
MinIO در حال اضافه کردن ریزسرویسهای NVIDIA NIM است تا مشتریان AIStor که مایل به استقرار PromptObject با استفاده از NIM هستند، بتوانند این کار را مستقیماً از کنسول جهانی AIStor انجام دهند.
ادغام آتی NVIDIA GPUDirect Storage (GDS) با MinIO AIStor یک راه حل مشترک است که به اشیاء از AIStor اجازه میدهد تا مستقیماً به حافظه GPU ارسال شوند بدون اینکه از حافظه CPU به عنوان بافر پرش استفاده شود، که تکنیکی است که امروزه باید از آن استفاده شود.
DPU NVIDIA BlueField-3 (BF3) دارای 16 هسته ARM، 400 گیگابیت بر ثانیه اترنت یا شبکهسازی InfiniBand و شتابدهندههای سختافزاری برای وظایفی مانند رمزگذاری، فشردهسازی و کدگذاری پاکسازی است. اندازه باینری کوچک AIStor (~100 مگابایت) AIStor را به یک نامزد ایدهآل برای استقرار بومی بر روی DPUهای BF3 تبدیل میکند، جایی که محدودیتهای منابع نیاز به نرمافزار سبک و در عین حال قدرتمند دارد.
AIStor که بر روی DPU BF3 مستقر شده است، یک پلتفرم را برای شرکتها فراهم میکند که به طور یکپارچه با معماری شبکهسازی Spectrum-X NVIDIA ادغام میشود. این امر عملکرد کم تاخیر و پهنای باند بالایی را که برای محیطهای هوش مصنوعی مورد نیاز است، ارائه میکند و انتقال دادههایی را تضمین میکند که GPUهای گرسنه را تغذیه کند. استقرار AIStor بر روی DPUهای BF3 همچنین به مشتریان این امکان را میدهد تا به راحتی از قابلیتهای GPU Direct Storage (GDS) استفاده کنند.
سایر مشارکتها
14. مشارکت جنرال موتورز برای ناوگان خودران
بخش مهمی از مشارکت جنرال موتورز با NVIDIA در ناوگان خودران آن، NVIDIA Halos خواهد بود، یک سیستم ایمنی جامع و کامل که معماری خودرو، مدلهای هوش مصنوعی، تراشهها، نرمافزار، ابزارها و خدمات را متحد میکند تا از توسعه ایمن وسایل نقلیه خودران (AV) از ابر به خودرو اطمینان حاصل کند.
این سیستم ایمنی را در طول چرخه توسعه کامل با نردههای محافظ در زمان طراحی، استقرار و اعتبارسنجی تضمین میکند که به طور جمعی ایمنی و قابلیت توضیح را در پشتههای AV مبتنی بر هوش مصنوعی ایجاد میکند. این نردههای محافظ با استفاده از سه کامپیوتر پیادهسازی میشوند: NVIDIA DGX برای آموزش، NVIDIA Omniverse و Cosmos برای شبیهسازی و NVIDIA AGX برای استقرار.
15. اختراع مشترک اپتیک بستهبندی شده NVIDIA (CPO) با شرکای اکوسیستم
NVIDIA سیستم سوئیچ فوتونیک خود را برای مراکز داده به اندازه زمینهای فوتبال معرفی کرد. هنگامی که یک مرکز داده به این بزرگی است، سیگنالها نمیتوانند به طور موثر با مس منتقل شوند. این همکاری با بسیاری از سازمانهای اکوسیستم منجر به در دسترس قرار گرفتن سوئیچ فوتونیک Quantum-X در نیمه دوم سال 2025 و سوئیچ فوتونیک Spectrum-C در نیمه دوم سال 2026 خواهد شد.
16. مشارکت هوش مصنوعی فیزیکی
NVIDIA هوش مصنوعی فیزیکی و رباتیک را به عنوان مرز بعدی هوش مصنوعی میبیند. در نتیجه، این شرکت با Disney Research و Google DeepMind در هوش مصنوعی فیزیکی همکاری کرد. این مشارکت پروژه نیوتن نام دارد و یک موتور فیزیک پیشرفته را دنبال خواهد کرد. پروژه نیوتن همچنین پیشگام مدل پایه GROOT N1 شد که دارای یک معماری سیستم دوگانه الهام گرفته از اصول شناخت انسانی است. اولین نمونه اولیه، "سیستم 1"، یک مدل عمل تفکر سریع است که بازتابها یا شهود انسانی را منعکس میکند. "سیستم 2" یک مدل تفکر کند برای تصمیمگیری عمدی و روشمند است. GROOT N1 متن باز خواهد بود.
17. هوش مصنوعی کامل پشته در لبه برای مخابرات
یک مشارکت NVIDIA با سیسکو، T-Mobile و ODC (یک شرکت مدیریت سبد Cerberus Capital) یک شبکه بیسیم مبتنی بر هوش مصنوعی کامل پشته، از جمله سختافزار، نرمافزار و معماری برای 6G، به طور واضح با تمرکز بر فعال کردن برنامههای کاربردی هوش مصنوعی لبه توسعه خواهد داد.
18. مشارکت با سیسکو
سیسکو Spectrum-X را در محصولات خود ادغام خواهد کرد.
خلاصه
NVIDIA فناوریها و مشارکتهای جدیدی را در رویداد مارس خود معرفی کرد که محاسبات، شبکهسازی و ذخیرهسازی را در بر میگیرد. خلاصهای عددی سریع به شرح زیر است:
محاسبات: شش پیشنهاد جدید محاسبات خام را برای سیستمهای رومیزی، موتورهای تجزیه و تحلیل و معماریهای GPU فراهم میکنند.
شبکهسازی: شش اعلامیه مربوط به شبکهسازی GPUها با هم است. این راهاندازیها شامل شبکهسازی GPUها در یک رک و فناوریهای شبکهسازی مورد نیاز توسط هایپراسکیلرها (یا سازمانهایی که مایل به تقلید از هایپراسکیلرها هستند) است، جایی که اندازه فیزیکی مرکز داده چالشهایی را ایجاد میکند.
ذخیرهسازی: MinIO و NVIDIA از نزدیک با هم کار کردهاند تا اطمینان حاصل کنند که ذخیرهسازی میتواند با شبکهسازی و محاسبات همگام باشد. MinIO اخیراً از پشتیبانی آینده برای چهار فناوری NVIDIA خبر داد: GPUDirect Storage، NIM، BlueField3 و اپراتور GPU.
سایر مشارکتها: پنج محصول که نتیجه مشارکتهای اضافی با جنرال موتورز، سیسکو، Disney Research، T-Mobile، Google DeepMind، ODC و یک اکوسیستم از شرکای فعال در زمینه سوئیچهای فوتونیک است.