تصویر از Hepha1st0s در Shutterstock.
تصویر از Hepha1st0s در Shutterstock.

خلاصه NVIDIA GTC 2025: 18 محصول جدید که باید زیر نظر داشته باشید

این پست توسط MinIO حمایت شده است.

اگر اخبار فناوری را دنبال می‌کنید، احتمالاً مطالب زیادی درباره NVIDIA و واحدهای پردازش گرافیکی (GPU) آن خوانده‌اید. با این حال، این نتیجه‌گیری که NVIDIA فقط بر روی GPUها متمرکز است، نادرست خواهد بود. بزرگ‌ترین کشف من از کنفرانس GTC 2025 NVIDIA در ماه گذشته این بود که NVIDIA در زمینه‌های محاسبات، شبکه‌سازی و ذخیره‌سازی نوآوری می‌کند. بیشتر این نوآوری‌ها در مورد هوش مصنوعی (Artificial Intelligence) هستند، اما گیمرها نباید نگران باشند؛ یک تراشه RTX جدید برای شما وجود دارد.

اعلامیه‌های جدید و فناوری‌های کلیدی که در سخنرانی اصلی جنسن هوانگ، مدیرعامل NVIDIA، مورد توجه قرار گرفتند، نشان می‌دهند که NVIDIA در زمینه‌های محاسبات، شبکه‌سازی، ذخیره‌سازی و مشارکت‌های خود چه کاری انجام می‌دهد. NVIDIA همچنین یک پیشنهاد برای متخصصان هوش مصنوعی در تمام ابعاد می‌خواهد: مهندسانی که آزمایش‌هایی را روی رایانه‌های رومیزی خود انجام می‌دهند؛ شرکت‌هایی که زیرساخت هوش مصنوعی را اجرا می‌کنند، که NVIDIA آن را فرصتی ۵۰۰ میلیارد دلاری می‌بیند؛ هایپراسکیلرهایی که به تجهیزات تخصصی شبکه‌سازی مبتنی بر فوتونیک نیاز دارند؛ و در نهایت، سازمان‌هایی که مرزهای هوش مصنوعی فیزیکی را با رباتیک جابجا می‌کنند.

بیایید با محاسبات شروع کنیم، زیرا این همان چیزی است که NVIDIA را با اولین GPUهای بازی خود روی نقشه قرار داد.

محاسبات

1. GeForce RTX 5090

GeForce RTX 5090، GPU رومیزی رده بالا جدید برای گیمرها و متخصصان خلاق خواهد بود. (آیا می‌دانستید که RTX مخفف Ray Tracing Texel Extreme است؟ این تکنیکی است که در بازی‌ها برای شبیه‌سازی نورپردازی و سایه‌های واقعی استفاده می‌شود.) گیمرها از تاخیر بهبود یافته ردیابی پرتو بهره‌مند خواهند شد. این تراشه بر اساس معماری NVIDIA Blackwell ساخته شده است و دارای ۳۲ گیگابایت حافظه پرسرعت Graphics Double Data Rate 7 (GDDR7) و ۳.۴ پتافلاپس FP4 compute است. در مقایسه با RTX 4090، ۳۰٪ کوچکتر است و ۳۰٪ بهتر در دفع گرما عمل می‌کند. خبر بد این است که این GPU برچسب قیمت 1,999 دلاری دارد. اگر شما یک مهندس هوش مصنوعی/یادگیری ماشین (ML) هستید، ممکن است وسوسه شوید که از آن برای آزمایش‌ها و حجم‌های کاری هوش مصنوعی استفاده کنید، اما قبل از انجام این کار، درباره DGX Spark (در زیر) بخوانید.

2. CUDA-X

NVIDIA CUDA-X یک اعلامیه جدید نیست. این تلاش برای مدتی در حال انجام بوده است. CUDA-X مجموعه‌ای از کتابخانه‌های بهینه شده است که بر روی CUDA ساخته شده‌اند تا هوش مصنوعی، محاسبات با کارایی بالا (HPC) و حجم‌های کاری علم داده را تسریع کنند. این کتابخانه‌ها به منظور کمک به توسعه‌دهندگان برای استفاده کامل از GPUهای NVIDIA برای طیف گسترده‌ای از برنامه‌ها بدون نیاز به نوشتن کد GPU سطح پایین طراحی شده‌اند. بسیاری از این کتابخانه‌ها جایگزین‌های فوری برای کتابخانه‌های موجود هستند که روی CPU اجرا می‌شوند. برای مثال، کتابخانه cuDF می‌تواند برای جایگزینی Pandas و Polars با صفر تغییر کد استفاده شود. در اینجا لیست کاملی از کتابخانه‌های ارائه شده وجود دارد:

  • cuPyNumeric: محاسبات عددی (جایگزین Numpy)
  • cuDF و cuML: علم داده و پردازش (جایگزین Pandas)
  • cuEquivariance و cuTensor: شیمی کوانتومی
  • cuLitho: لیتوگرافی محاسباتی
  • Earth-2: تحلیل آب و هوا
  • Aerial Sionna: پردازش سیگنال 5G/6G
  • cuOpt: بهینه‌سازی تصمیم‌گیری
  • Parabricks: توالی‌یابی ژن
  • Monai: تصویربرداری پزشکی
  • cuQuantim و Cuda-Q: شبیه‌سازی‌های محاسبات کوانتومی
  • TRT-LLM، Megatron، NCCL، cuDDN، Cutlass و cuBlas: یادگیری عمیق
  • cuDSS، cuSparse، cuFFT و AMGX: مهندسی به کمک کامپیوتر
  • Warp: فیزیک
کامپیوتر رومیزی DGX Spark
منبع: کامپیوتر رومیزی DGX Spark.

3. DGX Spark

DGX Spark انویدیا، که قبلاً به عنوان پروژه DIGITS در نمایشگاه CES 2025 در ژانویه معرفی شد، یک کامپیوتر رومیزی است که برای ارائه قدرت محاسباتی فراتر از سیستم‌های بازی طراحی شده است. DGX Spark برای توسعه‌دهندگان هوش مصنوعی، محققان و دانشمندان داده که نیاز به نمونه‌سازی، تنظیم دقیق و استقرار مدل‌های بزرگ هوش مصنوعی به صورت محلی دارند، بدون تکیه صرفاً بر منابع ابری یا مرکز داده، طراحی شده است. مشخصات:

  • تراشه: GB10 Grace Blackwell Superchip، که دارای یک GPU مبتنی بر معماری Blackwell و یک پردازنده Grace 20-core Arm است.
  • عملکرد: 1 پتافلاپس در FP4
  • حافظه: 128 گیگابایت حافظه یکپارچه
  • شبکه‌سازی: ConnectX-7 Smart NIC
  • ذخیره‌سازی: پشتیبانی از حداکثر 4 ترابایت حافظه NVMe SSD
  • پشته نرم‌افزاری NVIDIA AI از پیش نصب شده

ایسوس مدلی به نام ایسوس اسنت GX10 با 1 ترابایت فضای ذخیره‌سازی به قیمت 2,999 دلار ارائه خواهد کرد. اگر فضای ذخیره‌سازی بیشتری می‌خواهید، می‌توانید مستقیماً از NVIDIA خرید کنید و DGX Spark با 4 ترابایت فضای ذخیره‌سازی را به قیمت 3,999 دلار دریافت کنید. در نهایت، اگر می‌خواهید یک کارخانه کوچک هوش مصنوعی بسازید، می‌توانید دو DGX Spark را از NVIDIA با یک کابل اتصال به قیمت 8,049 دلار بخرید.

4. ایستگاه DGX

DGX Station نیز یک کامپیوتر رومیزی برای متخصصان هوش مصنوعی است. بسیار قدرتمندتر از DGX Spark خواهد بود و فقط از طریق شرکا در دسترس خواهد بود. NVIDIA نسخه خود از این کامپیوتر رومیزی را نخواهد ساخت. اطلاعات قیمت در دسترس نیست. با این حال، مشخصات اولیه آن نشان می‌دهد که پرهزینه خواهد بود. در اینجا مشخصاتی که NVIDIA تا به امروز منتشر کرده است، آمده است:

  • تراشه: NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip، که دارای یک GPU Blackwell Ultra و یک پردازنده Grace-72 Core Neoverse V2 است.
  • عملکرد: 20 پتافلاپس در FP4
  • حافظه GPU: حداکثر 288 گیگابایت HBM3e (8 ترابایت بر ثانیه)
  • حافظه CPU: حداکثر 496 گیگابایت LPDDR5X (حداکثر 396 گیگابایت بر ثانیه)
  • NVLink-C2C: حداکثر 900 گیگابایت بر ثانیه
  • شبکه‌سازی: ConnectX-8 SuperNIC (حداکثر 800 گیگابایت بر ثانیه)
  • پشته نرم‌افزاری NVIDIA AI از پیش نصب شده

5. معماری GPU دیوید بلک‌ول

GPU بلک‌ول در حال تولید کامل است و سفارش‌ها از چهار ارائه‌دهنده برتر خدمات ابری (اوراکل، گوگل، مایکروسافت و AWS) قبلاً از اوج سال فروش GPUهای هاپر فراتر رفته است. در سال 2024، NVIDIA 1.3 میلیون GPU هاپر فروخت و تا کنون در سال 2025، 3.6 میلیون سفارش برای بلک‌ول وجود دارد. علاوه بر این، GB200 NVL72 در حال اجرای Dynamo 40 برابر بهتر از هاپر برای استنتاج خواهد بود.

6. معماری GPU ورا روبین

نسل بعدی GPUهای مرکز داده مبتنی بر معماری روبین خواهد بود که به نام ورا روبین (Vera Rubin)، ستاره‌شناس آمریکایی که ماده تاریک را کشف کرد، نام‌گذاری شده است. وعده داده شده است که 2.5 برابر سریع‌تر از نسل قبلی خود خواهد بود. این تراشه با 288 گیگابایت حافظه HDM4 عرضه خواهد شد.

شبکه‌سازی GPUها

7. بلک‌ول GB200 NVL72

بلک‌ول GB200 NVL72 در حال حاضر در دسترس است. این تراشه 36 پردازنده Grace و 72 GPU بلک‌ول را در یک رک واحد متصل می‌کند. این به این 72 GPU اجازه می‌دهد تا به عنوان یک GPU غول‌پیکر واحد عمل کنند - چیزی که NVIDIA آن را مقیاس‌بندی نهایی می‌نامد. چنین سیستمی قادر به میزبانی مدل‌های زبانی بزرگ (LLM) تریلیون پارامتری است.

8. بلک‌ول اولترا GB300 NVL72

بلک‌ول اولترا NVL72 در نیمه دوم سال 2025 در دسترس خواهد بود. وعده داده شده است که 1.5 برابر عملکرد GB200 NVL72 را ارائه دهد. همچنین بهبودهایی در مجموعه دستورالعمل‌ها برای LLMها (دستورالعمل‌های توجه) وجود دارد و 1.5 برابر حافظه بیشتر وجود دارد.

9. ورا روبین NVL144

پیکربندی رک ورا روبین در نیمه دوم سال 2026 در دسترس خواهد بود. این پیکربندی 88 پردازنده ورا را با استفاده از NVLink-C2C و 144 GPU روبین را با استفاده از NVLink6 متصل می‌کند. تقریباً همه چیز در این طراحی جدید است به جز شاسی، که ارتقاء را آسان‌تر می‌کند.

10. ورا روبین اولترا NVL576

ورا روبین اولترا باید در نیمه دوم سال 2027 در دسترس باشد. پردازنده‌ها یکسان خواهند بود، اما این رک حاوی 576 GPU روبین اولترا متصل شده با استفاده از NVLink7 خواهد بود. وعده داده شده است که 14 برابر سریع‌تر از GB300 NVL72 باشد.

منبع: پست وبلاگ فنی NVIDIA، “معرفی NVIDIA Dynamo، یک چارچوب استنتاج توزیع شده کم تاخیر برای مقیاس‌بندی مدل‌های استدلال هوش مصنوعی”
منبع: پست وبلاگ فنی NVIDIA، “معرفی NVIDIA Dynamo، یک چارچوب استنتاج توزیع شده کم تاخیر برای مقیاس‌بندی مدل‌های استدلال هوش مصنوعی”.

11. NVIDIA Dynamo

بهترین راه برای میزبانی یک LLM تریلیون پارامتری، توزیع آن در چندین GPU متصل به هم با استفاده از NVL72 است. NVIDIA به این تکنیک، سرویس‌دهی جدا شده می‌گوید. با این حال، اگر یک LLM را در بین GPUها تقسیم کنید، نمی‌خواهید آن را به طور تصادفی انجام دهید. در عوض، می‌خواهید LLM را به گونه‌ای تقسیم کنید که ارتباطات درون فرآیندی را به حداقل برساند. همچنین می‌خواهید بتوانید هر بخش از LLM را به طور جداگانه مقیاس‌بندی کنید. (همان روشی که می‌توانید خدمات مختلف را در یک برنامه به طور جداگانه با استفاده از معماری میکروسرویس‌ها مقیاس‌بندی کنید.)

برای رفع چالش‌های استنتاج توزیع شده و جدا شده، NVIDIA Dynamo را ایجاد کرد، یک چارچوب استنتاج متن‌باز. این چارچوب قابلیت‌های زیر را ارائه می‌دهد:

  • برنامه‌ریز منابع GPU: یک موتور برنامه‌ریزی و زمان‌بندی که ظرفیت و فعالیت پیش‌پر کردن را در استقرارهای چند گره‌ای نظارت می‌کند تا منابع GPU را تنظیم کند و آن‌ها را در بین پیش‌پر کردن و رمزگشایی تخصیص دهد.
  • روتر هوشمند: یک موتور مسیریابی آگاه از حافظه پنهان (KV) که به طور موثر ترافیک ورودی را در ناوگان بزرگ GPU در استقرارهای چند گره‌ای هدایت می‌کند تا محاسبات مجدد پرهزینه را به حداقل برساند.
  • کتابخانه ارتباطی کم تاخیر: کتابخانه انتقال داده استنتاج پیشرفته که انتقال حافظه پنهان KV بین GPUها و در بین انواع حافظه و ذخیره‌سازی ناهمگن را تسریع می‌کند.
  • مدیر حافظه پنهان KV: یک موتور تخلیه حافظه پنهان KV آگاه از هزینه که حافظه پنهان KV را در سلسله مراتب مختلف حافظه انتقال می‌دهد و حافظه GPU با ارزش را آزاد می‌کند و در عین حال تجربه کاربری را حفظ می‌کند.

12. Spectrum-X

Spectrum-X نشان‌دهنده داستان مقیاس‌بندی NVIDIA است. بسیاری از مردم از ورود NVIDIA به دنیای اترنت (Ethernet) شگفت‌زده شدند، اما این شرکت می‌خواست به اترنت کمک کند تا بیشتر شبیه InfiniBand شود. (InfiniBand معمولاً برای محاسبات با کارایی بالا استفاده می‌شود، در حالی که اترنت برای شبکه‌سازی همه‌منظوره، مانند اتصال دستگاه‌ها، بهترین است.) بنابراین، این شرکت در Spectrum-X سرمایه‌گذاری کرد، که از یک Spectrum-X SuperNIC و یک سوئیچ اترنت Spectrum-X تشکیل شده است و به آن قابلیت‌هایی را داد که InfiniBand دارد.

ذخیره‌سازی

13. ذخیره‌سازی با سرعت بالا

تمام این محاسبات و شبکه‌سازی با سرعت بالا نیازمند ذخیره‌سازی با سرعت بالا برای تامین انرژی آن است. با در نظر گرفتن این هدف، MinIO با NVIDIA همکاری کرده است تا NVIDIA GPUDirect Storage، NVIDIA BlueField-3، NVIDIA NIM و اپراتور GPU NVIDIA را با AIStor ادغام کند. این ویژگی‌ها و ادغام‌های جدید برای مشتریان بتا AIStor MinIO تحت پیش‌نمایش خصوصی باز است.

PromptObject AIStor نحوه تعامل کاربران با اشیاء ذخیره شده را با اجازه دادن به آنها برای پرسیدن سؤال در مورد محتوای داده‌های خود و استخراج اطلاعات با استفاده از زبان طبیعی، بدون نیاز به نوشتن پرس و جوهای پیچیده یا کد، تغییر می‌دهد. اپراتور GPU NVIDIA بر روی چارچوب اپراتور Kubernetes ساخته شده است و یک راه حل اتوماسیون جامع برای مدیریت GPU ارائه می‌دهد. ادغام AIStor با اپراتور GPU NVIDIA به سازمان‌ها این امکان را می‌دهد تا به راحتی یک خوشه مبتنی بر GPU را برای استفاده با API PromptObject AIStor راه‌اندازی کنند.

MinIO در حال اضافه کردن ریزسرویس‌های NVIDIA NIM است تا مشتریان AIStor که مایل به استقرار PromptObject با استفاده از NIM هستند، بتوانند این کار را مستقیماً از کنسول جهانی AIStor انجام دهند.

ادغام آتی NVIDIA GPUDirect Storage (GDS) با MinIO AIStor یک راه حل مشترک است که به اشیاء از AIStor اجازه می‌دهد تا مستقیماً به حافظه GPU ارسال شوند بدون اینکه از حافظه CPU به عنوان بافر پرش استفاده شود، که تکنیکی است که امروزه باید از آن استفاده شود.

DPU NVIDIA BlueField-3 (BF3) دارای 16 هسته ARM، 400 گیگابیت بر ثانیه اترنت یا شبکه‌سازی InfiniBand و شتاب‌دهنده‌های سخت‌افزاری برای وظایفی مانند رمزگذاری، فشرده‌سازی و کدگذاری پاک‌سازی است. اندازه باینری کوچک AIStor (~100 مگابایت) AIStor را به یک نامزد ایده‌آل برای استقرار بومی بر روی DPUهای BF3 تبدیل می‌کند، جایی که محدودیت‌های منابع نیاز به نرم‌افزار سبک و در عین حال قدرتمند دارد.

AIStor که بر روی DPU BF3 مستقر شده است، یک پلتفرم را برای شرکت‌ها فراهم می‌کند که به طور یکپارچه با معماری شبکه‌سازی Spectrum-X NVIDIA ادغام می‌شود. این امر عملکرد کم تاخیر و پهنای باند بالایی را که برای محیط‌های هوش مصنوعی مورد نیاز است، ارائه می‌کند و انتقال داده‌هایی را تضمین می‌کند که GPUهای گرسنه را تغذیه کند. استقرار AIStor بر روی DPUهای BF3 همچنین به مشتریان این امکان را می‌دهد تا به راحتی از قابلیت‌های GPU Direct Storage (GDS) استفاده کنند.

سایر مشارکت‌ها

14. مشارکت جنرال موتورز برای ناوگان خودران

بخش مهمی از مشارکت جنرال موتورز با NVIDIA در ناوگان خودران آن، NVIDIA Halos خواهد بود، یک سیستم ایمنی جامع و کامل که معماری خودرو، مدل‌های هوش مصنوعی، تراشه‌ها، نرم‌افزار، ابزارها و خدمات را متحد می‌کند تا از توسعه ایمن وسایل نقلیه خودران (AV) از ابر به خودرو اطمینان حاصل کند.

این سیستم ایمنی را در طول چرخه توسعه کامل با نرده‌های محافظ در زمان طراحی، استقرار و اعتبارسنجی تضمین می‌کند که به طور جمعی ایمنی و قابلیت توضیح را در پشته‌های AV مبتنی بر هوش مصنوعی ایجاد می‌کند. این نرده‌های محافظ با استفاده از سه کامپیوتر پیاده‌سازی می‌شوند: NVIDIA DGX برای آموزش، NVIDIA Omniverse و Cosmos برای شبیه‌سازی و NVIDIA AGX برای استقرار.

15. اختراع مشترک اپتیک بسته‌بندی شده NVIDIA (CPO) با شرکای اکوسیستم

NVIDIA سیستم سوئیچ فوتونیک خود را برای مراکز داده به اندازه زمین‌های فوتبال معرفی کرد. هنگامی که یک مرکز داده به این بزرگی است، سیگنال‌ها نمی‌توانند به طور موثر با مس منتقل شوند. این همکاری با بسیاری از سازمان‌های اکوسیستم منجر به در دسترس قرار گرفتن سوئیچ فوتونیک Quantum-X در نیمه دوم سال 2025 و سوئیچ فوتونیک Spectrum-C در نیمه دوم سال 2026 خواهد شد.

16. مشارکت هوش مصنوعی فیزیکی

NVIDIA هوش مصنوعی فیزیکی و رباتیک را به عنوان مرز بعدی هوش مصنوعی می‌بیند. در نتیجه، این شرکت با Disney Research و Google DeepMind در هوش مصنوعی فیزیکی همکاری کرد. این مشارکت پروژه نیوتن نام دارد و یک موتور فیزیک پیشرفته را دنبال خواهد کرد. پروژه نیوتن همچنین پیشگام مدل پایه GROOT N1 شد که دارای یک معماری سیستم دوگانه الهام گرفته از اصول شناخت انسانی است. اولین نمونه اولیه، "سیستم 1"، یک مدل عمل تفکر سریع است که بازتاب‌ها یا شهود انسانی را منعکس می‌کند. "سیستم 2" یک مدل تفکر کند برای تصمیم‌گیری عمدی و روشمند است. GROOT N1 متن باز خواهد بود.

17. هوش مصنوعی کامل پشته در لبه برای مخابرات

یک مشارکت NVIDIA با سیسکو، T-Mobile و ODC (یک شرکت مدیریت سبد Cerberus Capital) یک شبکه بی‌سیم مبتنی بر هوش مصنوعی کامل پشته، از جمله سخت‌افزار، نرم‌افزار و معماری برای 6G، به طور واضح با تمرکز بر فعال کردن برنامه‌های کاربردی هوش مصنوعی لبه توسعه خواهد داد.

18. مشارکت با سیسکو

سیسکو Spectrum-X را در محصولات خود ادغام خواهد کرد.

خلاصه

NVIDIA فناوری‌ها و مشارکت‌های جدیدی را در رویداد مارس خود معرفی کرد که محاسبات، شبکه‌سازی و ذخیره‌سازی را در بر می‌گیرد. خلاصه‌ای عددی سریع به شرح زیر است:

محاسبات: شش پیشنهاد جدید محاسبات خام را برای سیستم‌های رومیزی، موتورهای تجزیه و تحلیل و معماری‌های GPU فراهم می‌کنند.

شبکه‌سازی: شش اعلامیه مربوط به شبکه‌سازی GPUها با هم است. این راه‌اندازی‌ها شامل شبکه‌سازی GPUها در یک رک و فناوری‌های شبکه‌سازی مورد نیاز توسط هایپراسکیلرها (یا سازمان‌هایی که مایل به تقلید از هایپراسکیلرها هستند) است، جایی که اندازه فیزیکی مرکز داده چالش‌هایی را ایجاد می‌کند.

ذخیره‌سازی: MinIO و NVIDIA از نزدیک با هم کار کرده‌اند تا اطمینان حاصل کنند که ذخیره‌سازی می‌تواند با شبکه‌سازی و محاسبات همگام باشد. MinIO اخیراً از پشتیبانی آینده برای چهار فناوری NVIDIA خبر داد: GPUDirect Storage، NIM، BlueField3 و اپراتور GPU.

سایر مشارکت‌ها: پنج محصول که نتیجه مشارکت‌های اضافی با جنرال موتورز، سیسکو، Disney Research، T-Mobile، Google DeepMind، ODC و یک اکوسیستم از شرکای فعال در زمینه سوئیچ‌های فوتونیک است.