روز چهارشنبه، اوپنایآی (OpenAI) از اولین پردازنده استنتاج سفارشی خود رونمایی کرد که با همکاری برودکام (Broadcom) طراحی و ساخته شده است. این پردازنده که «جالاپینو» (Jalapeño) نام دارد، بهطور خاص برای نیازهای منحصربهفرد سیستمهای استنتاج اوپنایآی طراحی شده است. به گفته این شرکت، مدلهای هوش مصنوعی خود اوپنایآی در توسعه این تراشه کمک کردهاند.
در حالی که این تراشه هنوز در دست آزمایش است، اوپنایآی میگوید نتایج اولیه نشاندهنده عملکرد بهازای هر وات (performance-per-watt) بهطور قابلتوجهی بهتر از جایگزینهای پیشرفته فعلی است.
همکاری میان این دو شرکت رسماً در ماه اکتبر اعلام شد، اما مدتها بود که شایعاتی درباره برنامههای اوپنایآی برای تولید تراشه با هدف کاهش وابستگی این شرکت به پردازندههای گرافیکی (GPUs) انویدیا منتشر شده بود. هر دو شرکت گوگل و آمازون نیز برای دستیابی به هدفی مشابه، تراشههای سفارشی خود را ساختهاند که اغلب «شتابدهندههای هوش مصنوعی» (AI accelerators) نامیده میشوند — سیلیکونهایی که بهطور خاص برای تسریع بارهای کاری یادگیری ماشین طراحی شدهاند.
گرگ براکمن، رئیس اوپنایآی، رویکرد این شرکت به توسعه تراشه را در پادکست داخلی این شرکت، اندکی پس از اعلام همکاری با برودکام توضیح داد.
براکمن در این قسمت گفت: «ما درک عمیقی از بار کاری داریم. ما واقعاً به دنبال بارهای کاری خاصی بودهایم که کمتر مورد توجه قرار گرفتهاند، و میپرسیدیم چگونه میتوانیم چیزی بسازیم که بتواند آنچه را ممکن است تسریع کند؟»
جالاپینو بهطور خاص برای استنتاج (inference) طراحی شده است، فرآیندی که در آن مدلهای هوش مصنوعی از پیش ساخته شده در پاسخ به دستورات کاربر اجرا میشوند. اوپنایآی در بیانیه خود بر هزینه عملیاتی پایین این تراشه هنگام اجرای مدلهای کدنویسی بلادرنگ تأکید کرد. این احتمال وجود دارد که وظایف نیازمند عملکرد بالا مانند پیشآموزش (pre-training) همچنان به سختافزار انویدیا وابسته باشند، اما حتی کاهشهای کوچک در هزینههای استنتاج نیز میتواند به بهبود درآمد شرکت کمک شایانی کند.
بهینهسازی سیستم استنتاج ممکن است عامل مهمی در اقتصاد آینده هوش مصنوعی باشد — و احتمالاً در هر لایه از پشته فناوری اتفاق خواهد افتاد. اوپنایآی در حال حاضر در حال ساخت محصولات عاملمحور (agentic products) مانند کدکس (Codex) و مدلهایی است که آنها را قدرت میبخشند، و همچنین مراکز دادهای برای اجرای این مدلها. حرکت به سمت تراشههای هدفمند به این شرکت امکان میدهد در این فرآیند حتی فراتر رود، همانطور که شرکت در اعلامیه خود توضیح داده است.
این شرکت نوشت: «اوپنایآی تنها مدلهای پیشرفته را توسعه نمیدهد یا محصولاتی بر اساس آنها نمیسازد؛ بلکه زیرساختهای زیرین آنها را طراحی میکند: معماری تراشه، هستهها، سیستمهای حافظه، شبکه، زمانبندی، سیستمهای استقرار و تجربه محصول. از آنجا که اوپنایآی در سراسر پشته فناوری فعالیت میکند، هر لایه میتواند حول یک هدف واحد بهینه شود: سریعتر، قابلاعتمادتر و مقرونبهصرفهتر کردن مدلهایش برای کاربران.»