اعتبار: VentureBeat ساخته شده با Midjourney
اعتبار: VentureBeat ساخته شده با Midjourney

تراشه جدید Ironwood گوگل ۲۴ برابر قدرتمندتر از سریع‌ترین ابررایانه جهان است

گوگل کلود روز چهارشنبه از واحد پردازش تانسور (TPU) نسل هفتم خود به نام Ironwood رونمایی کرد، یک شتاب‌دهنده سفارشی هوش مصنوعی که به ادعای این شرکت، هنگام استقرار در مقیاس بزرگ، بیش از ۲۴ برابر قدرت محاسباتی سریع‌ترین ابررایانه جهان را ارائه می‌دهد.

این تراشه جدید، که در Google Cloud Next ’25 معرفی شد، نشان‌دهنده یک چرخش مهم در استراتژی توسعه تراشه هوش مصنوعی گوگل است که یک دهه به طول انجامیده است. در حالی که نسل‌های قبلی TPUها در درجه اول برای هر دو حجم کاری آموزش و استنتاج طراحی شده بودند، Ironwood اولین تراشه‌ای است که به‌طور خاص برای استنتاج ساخته شده است - فرآیند استقرار مدل‌های هوش مصنوعی آموزش‌دیده برای پیش‌بینی یا تولید پاسخ.

امین وحدت، معاون رئیس و مدیر کل ML، سیستم‌ها و هوش مصنوعی ابری گوگل، در یک کنفرانس مطبوعاتی مجازی پیش از این رویداد گفت: «Ironwood برای پشتیبانی از این مرحله بعدی هوش مصنوعی مولد و الزامات محاسباتی و ارتباطی فوق‌العاده آن ساخته شده است.» وی افزود: «این همان چیزی است که ما آن را «عصر استنتاج» می‌نامیم، جایی که عوامل هوش مصنوعی به‌طور فعال داده‌ها را بازیابی و تولید می‌کنند تا به‌طور مشترک بینش‌ها و پاسخ‌ها را ارائه دهند، نه فقط داده‌ها.»

شکستن موانع محاسباتی: نگاهی به قدرت ۴۲.۵ اگزافلاپسی هوش مصنوعی Ironwood

مشخصات فنی Ironwood قابل توجه است. هنگامی که Ironwood به ۹۲۱۶ تراشه در هر پاد مقیاس شود، ۴۲.۵ اگزافلاپس قدرت محاسباتی ارائه می‌دهد - که El Capitan با ۱.۷ اگزافلاپس را که در حال حاضر سریع‌ترین ابررایانه جهان است، تحت‌الشعاع قرار می‌دهد. هر تراشه Ironwood منفرد، اوج محاسباتی ۴۶۱۴ ترافلاپس را ارائه می‌دهد.

Ironwood همچنین دارای پیشرفت‌های قابل توجهی در حافظه و پهنای باند است. هر تراشه دارای ۱۹۲ گیگابایت حافظه با پهنای باند بالا (HBM) است که شش برابر بیشتر از Trillium، TPU نسل قبلی گوگل است که سال گذشته معرفی شد. پهنای باند حافظه به ۷.۲ ترابیت در ثانیه در هر تراشه می‌رسد که ۴.۵ برابر بهبود نسبت به Trillium دارد.

شاید مهم‌تر از همه در عصر مراکز داده با محدودیت توان، Ironwood دو برابر عملکرد در هر وات را در مقایسه با Trillium ارائه می‌دهد و تقریباً ۳۰ برابر کارآمدتر از اولین Cloud TPU گوگل از سال ۲۰۱۸ است.

وحدت توضیح داد: «در زمانی که توان موجود یکی از محدودیت‌های ارائه قابلیت‌های هوش مصنوعی است، ما ظرفیت بسیار بیشتری را در هر وات برای حجم کاری مشتریان ارائه می‌دهیم.»

از ساخت مدل تا «ماشین‌های متفکر»: چرا تمرکز گوگل بر استنتاج اکنون مهم است

تأکید بر استنتاج به جای آموزش نشان‌دهنده یک نقطه عطف مهم در جدول زمانی هوش مصنوعی است. سال‌هاست که این صنعت بر ساخت مدل‌های پایه بزرگ‌تر تمرکز داشته است و شرکت‌ها عمدتاً بر اندازه پارامتر و قابلیت‌های آموزشی با یکدیگر رقابت می‌کنند. چرخش گوگل به سمت بهینه‌سازی استنتاج نشان می‌دهد که ما وارد مرحله جدیدی می‌شویم که در آن کارایی استقرار و قابلیت‌های استدلال در مرکز توجه قرار می‌گیرند.

این انتقال منطقی است. آموزش یک بار اتفاق می‌افتد، اما عملیات استنتاج میلیاردها بار در روز هنگام تعامل کاربران با سیستم‌های هوش مصنوعی رخ می‌دهد. اقتصاد هوش مصنوعی به طور فزاینده‌ای به هزینه‌های استنتاج گره خورده است، به ویژه با پیچیده‌تر و از نظر محاسباتی فشرده‌تر شدن مدل‌ها.

در طول کنفرانس مطبوعاتی، وحدت فاش کرد که گوگل در طول هشت سال گذشته، افزایش ۱۰ برابری سالانه در تقاضا برای محاسبات هوش مصنوعی را مشاهده کرده است - یک عامل خیره‌کننده ۱۰۰ میلیونی در مجموع. هیچ مقدار پیشرفت قانون مور نمی‌توانست این منحنی رشد را بدون معماری‌های تخصصی مانند Ironwood برآورده کند.

نکته قابل توجه، تمرکز بر «مدل‌های متفکر» است که به جای تشخیص الگوهای ساده، وظایف استدلالی پیچیده را انجام می‌دهند. این نشان می‌دهد که گوگل آینده هوش مصنوعی را نه تنها در مدل‌های بزرگ‌تر، بلکه در مدل‌هایی می‌بیند که می‌توانند مشکلات را تجزیه کنند، از طریق چندین مرحله استدلال کنند و اساساً فرآیندهای فکری شبیه به انسان را شبیه‌سازی کنند.

موتور تفکر Gemini: چگونه مدل‌های نسل بعدی گوگل از سخت‌افزار پیشرفته استفاده می‌کنند

گوگل Ironwood را به عنوان پایه و اساس پیشرفته‌ترین مدل‌های هوش مصنوعی خود، از جمله Gemini 2.5 قرار می‌دهد، که این شرکت آن را دارای «قابلیت‌های تفکر داخلی» توصیف می‌کند.

در این کنفرانس، گوگل همچنین از Gemini 2.5 Flash، نسخه مقرون‌به‌صرفه‌تر مدل شاخص خود، که «عمق استدلال را بر اساس پیچیدگی یک اعلان تنظیم می‌کند»، خبر داد. در حالی که Gemini 2.5 Pro برای موارد استفاده پیچیده مانند کشف دارو و مدل‌سازی مالی طراحی شده است، Gemini 2.5 Flash برای برنامه‌های روزمره که پاسخگویی در آنها حیاتی است، در نظر گرفته شده است.

این شرکت همچنین مجموعه کامل مدل‌های رسانه‌ای مولد خود، از جمله متن به تصویر، متن به ویدیو و قابلیت متن به موسیقی تازه اعلام شده به نام Lyria را به نمایش گذاشت. یک نمایش نشان داد که چگونه این ابزارها می‌توانند برای ایجاد یک ویدیوی تبلیغاتی کامل برای یک کنسرت مورد استفاده قرار گیرند.

فراتر از سیلیکون: استراتژی جامع زیرساخت گوگل شامل شبکه و نرم‌افزار است

Ironwood تنها بخشی از استراتژی گسترده‌تر زیرساخت هوش مصنوعی گوگل است. این شرکت همچنین Cloud WAN را معرفی کرد، یک سرویس شبکه گسترده مدیریت شده که به کسب‌وکارها امکان دسترسی به زیرساخت شبکه خصوصی در مقیاس سیاره‌ای گوگل را می‌دهد.

وحدت گفت: «Cloud WAN یک ستون فقرات شبکه سازمانی کاملاً مدیریت شده، قابل اجرا و ایمن است که عملکرد شبکه را تا ۴۰٪ بهبود می‌بخشد و در عین حال، کل هزینه مالکیت را به همان میزان ۴۰٪ کاهش می‌دهد.»

گوگل همچنین در حال گسترش پیشنهادات نرم‌افزاری خود برای حجم کاری هوش مصنوعی است، از جمله Pathways، زمان اجرای یادگیری ماشین که توسط Google DeepMind توسعه یافته است. Pathways on Google Cloud به مشتریان این امکان را می‌دهد که ارائه مدل را در صدها TPU مقیاس‌بندی کنند.

اقتصاد هوش مصنوعی: چگونه برنامه ۱۲ میلیارد دلاری تجارت ابری گوگل برای پیروزی در جنگ کارایی برنامه‌ریزی می‌کند

این اعلامیه‌های سخت‌افزاری و نرم‌افزاری در زمان حساسی برای Google Cloud ارائه می‌شوند، که در آخرین گزارش درآمد خود، ۱۲ میلیارد دلار درآمد در سه ماهه چهارم سال ۲۰۲۴ گزارش کرد که نسبت به سال قبل ۳۰٪ افزایش داشته است.

اقتصاد استقرار هوش مصنوعی به طور فزاینده‌ای به یک عامل متمایزکننده در جنگ‌های ابری تبدیل می‌شود. گوگل با رقابت شدیدی از سوی Microsoft Azure مواجه است که از مشارکت OpenAI خود برای ایجاد یک موقعیت بازار قوی استفاده کرده است و Amazon Web Services که همچنان به گسترش پیشنهادات تراشه‌های Trainium و Inferentia خود ادامه می‌دهد.

آنچه رویکرد گوگل را متمایز می‌کند، ادغام عمودی آن است. در حالی که رقبا با تولیدکنندگان تراشه مشارکت دارند یا استارت‌آپ‌ها را خریداری کرده‌اند، گوگل بیش از یک دهه است که TPUها را در داخل توسعه می‌دهد. این امر به شرکت کنترل بی‌نظیری بر پشته هوش مصنوعی خود، از سیلیکون گرفته تا نرم‌افزار و خدمات، می‌دهد.

گوگل با ارائه این فناوری به مشتریان سازمانی، شرط می‌بندد که تجربه سخت‌کوشی خود در ساخت تراشه‌ها برای جستجو، جیمیل و یوتیوب به مزیت‌های رقابتی در بازار سازمانی تبدیل شود. استراتژی واضح است: ارائه همان زیرساختی که به هوش مصنوعی خود گوگل قدرت می‌دهد، در مقیاس بزرگ، به هر کسی که مایل به پرداخت هزینه آن باشد.

اکوسیستم چندعاملی: طرح جسورانه گوگل برای سیستم‌های هوش مصنوعی که با هم کار می‌کنند

گوگل فراتر از سخت‌افزار، دیدگاهی را برای هوش مصنوعی ترسیم کرد که حول سیستم‌های چندعاملی متمرکز شده است. این شرکت از یک کیت توسعه عامل (ADK) رونمایی کرد که به توسعه‌دهندگان امکان می‌دهد سیستم‌هایی را بسازند که در آن چندین عامل هوش مصنوعی می‌توانند با هم کار کنند.

شاید مهم‌تر از همه، گوگل از یک «پروتکل قابلیت همکاری عامل به عامل» (A2A) رونمایی کرد که عوامل هوش مصنوعی ساخته شده بر روی چارچوب‌های مختلف و توسط فروشندگان مختلف را قادر می‌سازد تا با یکدیگر ارتباط برقرار کنند.

وحدت پیش‌بینی کرد: «سال ۲۰۲۵ یک سال انتقالی خواهد بود که در آن هوش مصنوعی مولد از پاسخ دادن به سؤالات منفرد به حل مشکلات پیچیده از طریق سیستم‌های عامل‌دار تغییر می‌کند.»

گوگل با بیش از ۵۰ رهبر صنعت، از جمله Salesforce، ServiceNow و SAP برای پیشبرد این استاندارد قابلیت همکاری همکاری می‌کند.

بررسی واقعیت سازمانی: قدرت و کارایی Ironwood چه معنایی برای استراتژی هوش مصنوعی شما دارد

برای شرکت‌هایی که هوش مصنوعی را مستقر می‌کنند، این اعلامیه‌ها می‌توانند به طور قابل توجهی هزینه و پیچیدگی اجرای مدل‌های هوش مصنوعی پیچیده را کاهش دهند. کارایی بهبود یافته Ironwood می‌تواند اجرای مدل‌های استدلال پیشرفته را اقتصادی‌تر کند، در حالی که پروتکل قابلیت همکاری عامل می‌تواند به کسب‌وکارها کمک کند تا از قفل شدن در یک فروشنده اجتناب کنند.

نباید تأثیر واقعی این پیشرفت‌ها را دست کم گرفت. بسیاری از سازمان‌ها به دلیل هزینه‌های زیرساختی و مصرف انرژی بازدارنده، از استقرار مدل‌های پیشرفته هوش مصنوعی اکراه داشته‌اند. اگر گوگل بتواند به وعده‌های عملکرد در هر وات خود عمل کند، می‌توانیم شاهد موج جدیدی از پذیرش هوش مصنوعی در صنایعی باشیم که تاکنون در حاشیه مانده‌اند.

رویکرد چندعاملی به همان اندازه برای شرکت‌هایی که از پیچیدگی استقرار هوش مصنوعی در سیستم‌ها و فروشندگان مختلف غرق شده‌اند، مهم است. گوگل با استانداردسازی نحوه ارتباط سیستم‌های هوش مصنوعی، در تلاش است تا سیلوهایی را که تأثیر سازمانی هوش مصنوعی را محدود کرده‌اند، از بین ببرد.

در طول کنفرانس مطبوعاتی، گوگل تأکید کرد که بیش از ۴۰۰ داستان مشتری در Next ’25 به اشتراک گذاشته می‌شود که نشان‌دهنده تأثیر واقعی کسب‌وکار از نوآوری‌های هوش مصنوعی آن است.

مسابقه تسلیحاتی سیلیکونی: آیا تراشه‌های سفارشی گوگل و استانداردهای باز آینده هوش مصنوعی را تغییر می‌دهند؟

با ادامه پیشرفت هوش مصنوعی، زیرساخت‌هایی که به آن قدرت می‌دهند به طور فزاینده‌ای حیاتی خواهند شد. سرمایه‌گذاری‌های گوگل در سخت‌افزار تخصصی مانند Ironwood، همراه با ابتکارات قابلیت همکاری عامل آن، نشان می‌دهد که این شرکت خود را برای آینده‌ای آماده می‌کند که در آن هوش مصنوعی توزیع‌شده‌تر، پیچیده‌تر و عمیق‌تر در عملیات تجاری ادغام می‌شود.

وحدت خاطرنشان کرد: «مدل‌های تفکر پیشرو مانند Gemini 2.5 و AlphaFold برنده جایزه نوبل، همگی امروزه بر روی TPUها اجرا می‌شوند.» وی افزود: «ما مشتاقانه منتظریم تا ببینیم چه پیشرفت‌های هوش مصنوعی توسط توسعه‌دهندگان خودمان و مشتریان Google Cloud با Ironwood ایجاد می‌شود، زمانی که در اواخر سال جاری در دسترس قرار گیرد.»

پیامدهای استراتژیک فراتر از کسب‌وکار خود گوگل است. گوگل با تلاش برای استانداردهای باز در ارتباطات عامل و در عین حال حفظ مزایای اختصاصی در سخت‌افزار، در تلاش است تا تعادل ظریفی را حفظ کند. این شرکت می‌خواهد اکوسیستم گسترده‌تر شکوفا شود (با زیرساخت گوگل در زیر)، در حالی که هنوز تمایز رقابتی را حفظ می‌کند.

سرعت واکنش رقبا به پیشرفت‌های سخت‌افزاری گوگل و اینکه آیا صنعت حول استانداردهای پیشنهادی قابلیت همکاری عامل متحد می‌شود یا خیر، عوامل کلیدی برای تماشا در ماه‌های آینده خواهند بود. اگر تاریخ راهنمایی کند، می‌توانیم انتظار داشته باشیم که مایکروسافت و آمازون با استراتژی‌های بهینه‌سازی استنتاج خود به مقابله بپردازند و به طور بالقوه یک مسابقه سه طرفه را برای ساخت کارآمدترین پشته زیرساخت هوش مصنوعی ایجاد کنند.