گوگل کلود روز چهارشنبه از واحد پردازش تانسور (TPU) نسل هفتم خود به نام Ironwood رونمایی کرد، یک شتابدهنده سفارشی هوش مصنوعی که به ادعای این شرکت، هنگام استقرار در مقیاس بزرگ، بیش از ۲۴ برابر قدرت محاسباتی سریعترین ابررایانه جهان را ارائه میدهد.
این تراشه جدید، که در Google Cloud Next ’25 معرفی شد، نشاندهنده یک چرخش مهم در استراتژی توسعه تراشه هوش مصنوعی گوگل است که یک دهه به طول انجامیده است. در حالی که نسلهای قبلی TPUها در درجه اول برای هر دو حجم کاری آموزش و استنتاج طراحی شده بودند، Ironwood اولین تراشهای است که بهطور خاص برای استنتاج ساخته شده است - فرآیند استقرار مدلهای هوش مصنوعی آموزشدیده برای پیشبینی یا تولید پاسخ.
امین وحدت، معاون رئیس و مدیر کل ML، سیستمها و هوش مصنوعی ابری گوگل، در یک کنفرانس مطبوعاتی مجازی پیش از این رویداد گفت: «Ironwood برای پشتیبانی از این مرحله بعدی هوش مصنوعی مولد و الزامات محاسباتی و ارتباطی فوقالعاده آن ساخته شده است.» وی افزود: «این همان چیزی است که ما آن را «عصر استنتاج» مینامیم، جایی که عوامل هوش مصنوعی بهطور فعال دادهها را بازیابی و تولید میکنند تا بهطور مشترک بینشها و پاسخها را ارائه دهند، نه فقط دادهها.»
شکستن موانع محاسباتی: نگاهی به قدرت ۴۲.۵ اگزافلاپسی هوش مصنوعی Ironwood
مشخصات فنی Ironwood قابل توجه است. هنگامی که Ironwood به ۹۲۱۶ تراشه در هر پاد مقیاس شود، ۴۲.۵ اگزافلاپس قدرت محاسباتی ارائه میدهد - که El Capitan با ۱.۷ اگزافلاپس را که در حال حاضر سریعترین ابررایانه جهان است، تحتالشعاع قرار میدهد. هر تراشه Ironwood منفرد، اوج محاسباتی ۴۶۱۴ ترافلاپس را ارائه میدهد.
Ironwood همچنین دارای پیشرفتهای قابل توجهی در حافظه و پهنای باند است. هر تراشه دارای ۱۹۲ گیگابایت حافظه با پهنای باند بالا (HBM) است که شش برابر بیشتر از Trillium، TPU نسل قبلی گوگل است که سال گذشته معرفی شد. پهنای باند حافظه به ۷.۲ ترابیت در ثانیه در هر تراشه میرسد که ۴.۵ برابر بهبود نسبت به Trillium دارد.
شاید مهمتر از همه در عصر مراکز داده با محدودیت توان، Ironwood دو برابر عملکرد در هر وات را در مقایسه با Trillium ارائه میدهد و تقریباً ۳۰ برابر کارآمدتر از اولین Cloud TPU گوگل از سال ۲۰۱۸ است.
وحدت توضیح داد: «در زمانی که توان موجود یکی از محدودیتهای ارائه قابلیتهای هوش مصنوعی است، ما ظرفیت بسیار بیشتری را در هر وات برای حجم کاری مشتریان ارائه میدهیم.»
از ساخت مدل تا «ماشینهای متفکر»: چرا تمرکز گوگل بر استنتاج اکنون مهم است
تأکید بر استنتاج به جای آموزش نشاندهنده یک نقطه عطف مهم در جدول زمانی هوش مصنوعی است. سالهاست که این صنعت بر ساخت مدلهای پایه بزرگتر تمرکز داشته است و شرکتها عمدتاً بر اندازه پارامتر و قابلیتهای آموزشی با یکدیگر رقابت میکنند. چرخش گوگل به سمت بهینهسازی استنتاج نشان میدهد که ما وارد مرحله جدیدی میشویم که در آن کارایی استقرار و قابلیتهای استدلال در مرکز توجه قرار میگیرند.
این انتقال منطقی است. آموزش یک بار اتفاق میافتد، اما عملیات استنتاج میلیاردها بار در روز هنگام تعامل کاربران با سیستمهای هوش مصنوعی رخ میدهد. اقتصاد هوش مصنوعی به طور فزایندهای به هزینههای استنتاج گره خورده است، به ویژه با پیچیدهتر و از نظر محاسباتی فشردهتر شدن مدلها.
در طول کنفرانس مطبوعاتی، وحدت فاش کرد که گوگل در طول هشت سال گذشته، افزایش ۱۰ برابری سالانه در تقاضا برای محاسبات هوش مصنوعی را مشاهده کرده است - یک عامل خیرهکننده ۱۰۰ میلیونی در مجموع. هیچ مقدار پیشرفت قانون مور نمیتوانست این منحنی رشد را بدون معماریهای تخصصی مانند Ironwood برآورده کند.
نکته قابل توجه، تمرکز بر «مدلهای متفکر» است که به جای تشخیص الگوهای ساده، وظایف استدلالی پیچیده را انجام میدهند. این نشان میدهد که گوگل آینده هوش مصنوعی را نه تنها در مدلهای بزرگتر، بلکه در مدلهایی میبیند که میتوانند مشکلات را تجزیه کنند، از طریق چندین مرحله استدلال کنند و اساساً فرآیندهای فکری شبیه به انسان را شبیهسازی کنند.
موتور تفکر Gemini: چگونه مدلهای نسل بعدی گوگل از سختافزار پیشرفته استفاده میکنند
گوگل Ironwood را به عنوان پایه و اساس پیشرفتهترین مدلهای هوش مصنوعی خود، از جمله Gemini 2.5 قرار میدهد، که این شرکت آن را دارای «قابلیتهای تفکر داخلی» توصیف میکند.
در این کنفرانس، گوگل همچنین از Gemini 2.5 Flash، نسخه مقرونبهصرفهتر مدل شاخص خود، که «عمق استدلال را بر اساس پیچیدگی یک اعلان تنظیم میکند»، خبر داد. در حالی که Gemini 2.5 Pro برای موارد استفاده پیچیده مانند کشف دارو و مدلسازی مالی طراحی شده است، Gemini 2.5 Flash برای برنامههای روزمره که پاسخگویی در آنها حیاتی است، در نظر گرفته شده است.
این شرکت همچنین مجموعه کامل مدلهای رسانهای مولد خود، از جمله متن به تصویر، متن به ویدیو و قابلیت متن به موسیقی تازه اعلام شده به نام Lyria را به نمایش گذاشت. یک نمایش نشان داد که چگونه این ابزارها میتوانند برای ایجاد یک ویدیوی تبلیغاتی کامل برای یک کنسرت مورد استفاده قرار گیرند.
فراتر از سیلیکون: استراتژی جامع زیرساخت گوگل شامل شبکه و نرمافزار است
Ironwood تنها بخشی از استراتژی گستردهتر زیرساخت هوش مصنوعی گوگل است. این شرکت همچنین Cloud WAN را معرفی کرد، یک سرویس شبکه گسترده مدیریت شده که به کسبوکارها امکان دسترسی به زیرساخت شبکه خصوصی در مقیاس سیارهای گوگل را میدهد.
وحدت گفت: «Cloud WAN یک ستون فقرات شبکه سازمانی کاملاً مدیریت شده، قابل اجرا و ایمن است که عملکرد شبکه را تا ۴۰٪ بهبود میبخشد و در عین حال، کل هزینه مالکیت را به همان میزان ۴۰٪ کاهش میدهد.»
گوگل همچنین در حال گسترش پیشنهادات نرمافزاری خود برای حجم کاری هوش مصنوعی است، از جمله Pathways، زمان اجرای یادگیری ماشین که توسط Google DeepMind توسعه یافته است. Pathways on Google Cloud به مشتریان این امکان را میدهد که ارائه مدل را در صدها TPU مقیاسبندی کنند.
اقتصاد هوش مصنوعی: چگونه برنامه ۱۲ میلیارد دلاری تجارت ابری گوگل برای پیروزی در جنگ کارایی برنامهریزی میکند
این اعلامیههای سختافزاری و نرمافزاری در زمان حساسی برای Google Cloud ارائه میشوند، که در آخرین گزارش درآمد خود، ۱۲ میلیارد دلار درآمد در سه ماهه چهارم سال ۲۰۲۴ گزارش کرد که نسبت به سال قبل ۳۰٪ افزایش داشته است.
اقتصاد استقرار هوش مصنوعی به طور فزایندهای به یک عامل متمایزکننده در جنگهای ابری تبدیل میشود. گوگل با رقابت شدیدی از سوی Microsoft Azure مواجه است که از مشارکت OpenAI خود برای ایجاد یک موقعیت بازار قوی استفاده کرده است و Amazon Web Services که همچنان به گسترش پیشنهادات تراشههای Trainium و Inferentia خود ادامه میدهد.
آنچه رویکرد گوگل را متمایز میکند، ادغام عمودی آن است. در حالی که رقبا با تولیدکنندگان تراشه مشارکت دارند یا استارتآپها را خریداری کردهاند، گوگل بیش از یک دهه است که TPUها را در داخل توسعه میدهد. این امر به شرکت کنترل بینظیری بر پشته هوش مصنوعی خود، از سیلیکون گرفته تا نرمافزار و خدمات، میدهد.
گوگل با ارائه این فناوری به مشتریان سازمانی، شرط میبندد که تجربه سختکوشی خود در ساخت تراشهها برای جستجو، جیمیل و یوتیوب به مزیتهای رقابتی در بازار سازمانی تبدیل شود. استراتژی واضح است: ارائه همان زیرساختی که به هوش مصنوعی خود گوگل قدرت میدهد، در مقیاس بزرگ، به هر کسی که مایل به پرداخت هزینه آن باشد.
اکوسیستم چندعاملی: طرح جسورانه گوگل برای سیستمهای هوش مصنوعی که با هم کار میکنند
گوگل فراتر از سختافزار، دیدگاهی را برای هوش مصنوعی ترسیم کرد که حول سیستمهای چندعاملی متمرکز شده است. این شرکت از یک کیت توسعه عامل (ADK) رونمایی کرد که به توسعهدهندگان امکان میدهد سیستمهایی را بسازند که در آن چندین عامل هوش مصنوعی میتوانند با هم کار کنند.
شاید مهمتر از همه، گوگل از یک «پروتکل قابلیت همکاری عامل به عامل» (A2A) رونمایی کرد که عوامل هوش مصنوعی ساخته شده بر روی چارچوبهای مختلف و توسط فروشندگان مختلف را قادر میسازد تا با یکدیگر ارتباط برقرار کنند.
وحدت پیشبینی کرد: «سال ۲۰۲۵ یک سال انتقالی خواهد بود که در آن هوش مصنوعی مولد از پاسخ دادن به سؤالات منفرد به حل مشکلات پیچیده از طریق سیستمهای عاملدار تغییر میکند.»
گوگل با بیش از ۵۰ رهبر صنعت، از جمله Salesforce، ServiceNow و SAP برای پیشبرد این استاندارد قابلیت همکاری همکاری میکند.
بررسی واقعیت سازمانی: قدرت و کارایی Ironwood چه معنایی برای استراتژی هوش مصنوعی شما دارد
برای شرکتهایی که هوش مصنوعی را مستقر میکنند، این اعلامیهها میتوانند به طور قابل توجهی هزینه و پیچیدگی اجرای مدلهای هوش مصنوعی پیچیده را کاهش دهند. کارایی بهبود یافته Ironwood میتواند اجرای مدلهای استدلال پیشرفته را اقتصادیتر کند، در حالی که پروتکل قابلیت همکاری عامل میتواند به کسبوکارها کمک کند تا از قفل شدن در یک فروشنده اجتناب کنند.
نباید تأثیر واقعی این پیشرفتها را دست کم گرفت. بسیاری از سازمانها به دلیل هزینههای زیرساختی و مصرف انرژی بازدارنده، از استقرار مدلهای پیشرفته هوش مصنوعی اکراه داشتهاند. اگر گوگل بتواند به وعدههای عملکرد در هر وات خود عمل کند، میتوانیم شاهد موج جدیدی از پذیرش هوش مصنوعی در صنایعی باشیم که تاکنون در حاشیه ماندهاند.
رویکرد چندعاملی به همان اندازه برای شرکتهایی که از پیچیدگی استقرار هوش مصنوعی در سیستمها و فروشندگان مختلف غرق شدهاند، مهم است. گوگل با استانداردسازی نحوه ارتباط سیستمهای هوش مصنوعی، در تلاش است تا سیلوهایی را که تأثیر سازمانی هوش مصنوعی را محدود کردهاند، از بین ببرد.
در طول کنفرانس مطبوعاتی، گوگل تأکید کرد که بیش از ۴۰۰ داستان مشتری در Next ’25 به اشتراک گذاشته میشود که نشاندهنده تأثیر واقعی کسبوکار از نوآوریهای هوش مصنوعی آن است.
مسابقه تسلیحاتی سیلیکونی: آیا تراشههای سفارشی گوگل و استانداردهای باز آینده هوش مصنوعی را تغییر میدهند؟
با ادامه پیشرفت هوش مصنوعی، زیرساختهایی که به آن قدرت میدهند به طور فزایندهای حیاتی خواهند شد. سرمایهگذاریهای گوگل در سختافزار تخصصی مانند Ironwood، همراه با ابتکارات قابلیت همکاری عامل آن، نشان میدهد که این شرکت خود را برای آیندهای آماده میکند که در آن هوش مصنوعی توزیعشدهتر، پیچیدهتر و عمیقتر در عملیات تجاری ادغام میشود.
وحدت خاطرنشان کرد: «مدلهای تفکر پیشرو مانند Gemini 2.5 و AlphaFold برنده جایزه نوبل، همگی امروزه بر روی TPUها اجرا میشوند.» وی افزود: «ما مشتاقانه منتظریم تا ببینیم چه پیشرفتهای هوش مصنوعی توسط توسعهدهندگان خودمان و مشتریان Google Cloud با Ironwood ایجاد میشود، زمانی که در اواخر سال جاری در دسترس قرار گیرد.»
پیامدهای استراتژیک فراتر از کسبوکار خود گوگل است. گوگل با تلاش برای استانداردهای باز در ارتباطات عامل و در عین حال حفظ مزایای اختصاصی در سختافزار، در تلاش است تا تعادل ظریفی را حفظ کند. این شرکت میخواهد اکوسیستم گستردهتر شکوفا شود (با زیرساخت گوگل در زیر)، در حالی که هنوز تمایز رقابتی را حفظ میکند.
سرعت واکنش رقبا به پیشرفتهای سختافزاری گوگل و اینکه آیا صنعت حول استانداردهای پیشنهادی قابلیت همکاری عامل متحد میشود یا خیر، عوامل کلیدی برای تماشا در ماههای آینده خواهند بود. اگر تاریخ راهنمایی کند، میتوانیم انتظار داشته باشیم که مایکروسافت و آمازون با استراتژیهای بهینهسازی استنتاج خود به مقابله بپردازند و به طور بالقوه یک مسابقه سه طرفه را برای ساخت کارآمدترین پشته زیرساخت هوش مصنوعی ایجاد کنند.