به گفته افراد آگاه، انتظار میرود هواوی از ماه آینده ارسال گسترده تراشه هوش مصنوعی Ascend 910C را آغاز کند.
در حالی که مقادیر محدودی قبلاً تحویل داده شده است، استقرار گسترده گام مهمی برای شرکتهای چینی خواهد بود که به دنبال جایگزینهای داخلی برای نیمهرساناهای ساخت آمریکا هستند.
این اقدام در زمانی صورت میگیرد که توسعهدهندگان چینی با محدودیتهای سختتری در دسترسی به سختافزار انویدیا (Nvidia) روبرو هستند. دولت ایالات متحده اخیراً به انویدیا اطلاع داده است که فروش تراشه هوش مصنوعی H20 به چین نیاز به مجوز صادرات دارد. این امر باعث شده است که توسعهدهندگان در چین به دنبال گزینههایی باشند که بتوانند از حجم کاری آموزش و استنتاج در مقیاس بزرگ پشتیبانی کنند.
تراشه Ascend 910C هواوی بر روی پیشرفتهترین گرههای فرآیندی ساخته نشده است، اما نشاندهنده یک راه حل است. این تراشه اساساً یک نسخه دو بستهای از 910B قبلی است، با دو پردازنده برای دو برابر کردن عملکرد و حافظه. منابع آگاه به تراشه میگویند که عملکرد آن با H100 انویدیا قابل مقایسه است.
هواوی به جای تکیه بر تولید پیشرفته، یک رویکرد مبتنی بر نیروی brute-force را اتخاذ کرده است، و چندین تراشه و اتصالات نوری پرسرعت را برای افزایش عملکرد ترکیب میکند. این رویکرد برای سیستم CloudMatrix 384 هواوی، یک پلتفرم هوش مصنوعی در مقیاس کامل رک برای آموزش مدلهای بزرگ، اساسی است.
CloudMatrix 384 دارای 384 تراشه Ascend 910C هواوی است که در 16 رک شامل 12 رک محاسباتی و چهار رک شبکه مستقر شدهاند. برخلاف سیستمهای مبتنی بر مس، پلتفرم هواوی از اتصالات نوری استفاده میکند که امکان ارتباط پهنای باند بالا بین اجزای سیستم را فراهم میکند. بر اساس تجزیه و تحلیل SemiAnalysis، معماری شامل 6912 فرستنده و گیرنده نوری 800G LPO برای تشکیل یک شبکه مش نوری all-to-all است.
این امر به سیستم هواوی اجازه میدهد تا تقریباً 300 پتافلاپس (petaFLOPs) توان محاسباتی BF16 را ارائه دهد - که از سیستم GB200 NVL72 انویدیا، که به حدود 180 پتافلاپس BF16 میرسد، پیشی میگیرد. CloudMatrix همچنین ادعا میکند که مزایایی در پهنای باند و ظرفیت حافظه بالاتر دارد و بیش از دو برابر پهنای باند و بیش از 3.6 برابر ظرفیت حافظه با پهنای باند بالا (HBM) را ارائه میدهد.
با این حال، این دستاوردها بدون اشکال نیستند. پیشبینی میشود سیستم هواوی 2.3 برابر بازدهی کمتری در هر عملیات ممیز شناور نسبت به GB200 انویدیا داشته باشد و راندمان انرژی کمتری در هر واحد پهنای باند و ظرفیت حافظه داشته باشد. با وجود عملکرد کمتر در هر وات، سیستم هواوی همچنان زیرساخت مورد نیاز برای آموزش مدلهای پیشرفته هوش مصنوعی در مقیاس را فراهم میکند.
منابع نشان میدهند که بزرگترین کارخانه تراشهسازی چین، SMIC، در حال تولید برخی از اجزای اصلی 910C با استفاده از فرآیند 7nm N+2 خود است. با این حال، سطوح بازدهی همچنان نگران کننده است و برخی از واحدهای 910C گزارش شده شامل تراشههای تولید شده توسط TSMC برای شرکت چینی Sophgo هستند. هواوی استفاده از قطعات ساخت TSMC را رد کرده است.
وزارت بازرگانی ایالات متحده در حال حاضر در حال بررسی رابطه بین TSMC و Sophgo است، پس از اینکه یک تراشه طراحی شده توسط Sophgo در پردازنده 910B قبلی هواوی یافت شد. TSMC اعلام کرده است که از سال 2020 هیچ قطعهای را به هواوی عرضه نکرده است و همچنان به مقررات صادراتی پایبند است.
در اواخر سال 2023، هواوی شروع به توزیع نمونههای اولیه 910C به شرکتهای فناوری منتخب کرد و دفتر سفارشات خود را باز کرد. شرکت مشاوره Albright Stonebridge Group پیشنهاد کرد که این تراشه احتمالاً به انتخاب اصلی برای شرکتهای چینی تبدیل خواهد شد که مدلهای بزرگ هوش مصنوعی میسازند یا ظرفیت استنتاج را مستقر میکنند، با توجه به کنترلهای صادراتی مداوم بر روی تراشههای ساخت آمریکا.
در حالی که Ascend 910C هواوی ممکن است با انویدیا در راندمان انرژی یا فناوری فرآیند مطابقت نداشته باشد، اما نشاندهنده یک روند گستردهتر است. شرکتهای فناوری چینی در حال توسعه جایگزینهای داخلی برای قطعات خارجی هستند، حتی اگر به معنای استفاده از روشهای کمتر پیشرفته برای دستیابی به نتایج مشابه باشد.
همزمان با افزایش تقاضای جهانی هوش مصنوعی و تشدید محدودیتهای صادراتی، توانایی هواوی در ارائه یک راه حل سختافزاری هوش مصنوعی مقیاسپذیر در داخل کشور میتواند به شکلگیری آینده هوش مصنوعی چین کمک کند - به ویژه زمانی که توسعهدهندگان به دنبال ایمنسازی زنجیرههای تامین بلندمدت و کاهش قرار گرفتن در معرض خطر ژئوپلیتیکی هستند.
(عکس از طریق Unsplash)
همچنین ببینید: پیشرفت سختافزاری هوش مصنوعی هواوی، سلطه انویدیا را به چالش میکشد