پردازنده گرافیکی AMD Instinct MI300X. اعتبار تصویر: AMD
پردازنده گرافیکی AMD Instinct MI300X. اعتبار تصویر: AMD

همکاری Rapt AI و AMD برای افزایش بهره‌وری استفاده از GPU

شرکت Rapt AI، ارائه‌دهنده اتوماسیون بار کاری هوش مصنوعی مبتنی بر هوش مصنوعی برای پردازنده‌های گرافیکی (GPU) و شتاب‌دهنده‌های هوش مصنوعی، با AMD برای بهبود زیرساخت هوش مصنوعی همکاری کرده است.

هدف این همکاری استراتژیک بلندمدت، بهبود مدیریت بار کاری و عملکرد استنتاج و آموزش هوش مصنوعی در پردازنده‌های گرافیکی AMD Instinct است و به مشتریان راه‌حلی مقیاس‌پذیر و مقرون‌به‌صرفه برای استقرار برنامه‌های کاربردی هوش مصنوعی ارائه می‌دهد.

با شتاب گرفتن پذیرش هوش مصنوعی، سازمان‌ها با چالش‌هایی مانند تخصیص منابع، گلوگاه‌های عملکردی و مدیریت پیچیده GPU دست و پنجه نرم می‌کنند.

با ادغام پلتفرم اتوماسیون هوشمند بار کاری Rapt با پردازنده‌های گرافیکی سری AMD Instinct MI300X، MI325X و سری آتی MI350، این همکاری راه‌حلی مقیاس‌پذیر، با کارایی بالا و مقرون‌به‌صرفه ارائه می‌دهد که مشتریان را قادر می‌سازد تا کارایی استنتاج و آموزش هوش مصنوعی را در زیرساخت‌های محلی (on-premises) و چندابری (multi-cloud) به حداکثر برسانند.

پردازنده گرافیکی AMD Instinct MI325X.
پردازنده گرافیکی AMD Instinct MI325X.

راه‌حلی کارآمدتر

چارلی لیمینگ، مدیرعامل Rapt AI، در یک نشست خبری گفت: «مدل‌های هوش مصنوعی که امروزه می‌بینیم بسیار بزرگ و مهم‌تر از همه، بسیار پویا و غیرقابل پیش‌بینی هستند. ابزارهای قدیمی برای بهینه‌سازی اصلاً مناسب نیستند. ما این پویایی‌ها را مشاهده کردیم. شرکت‌ها پول زیادی خرج می‌کنند. استعدادهای جدیدی در زمینه هوش مصنوعی استخدام می‌کنند. این یکی از آن فناوری‌های تحول‌آفرین است. ما در سناریویی هستیم که مدیران مالی و مدیران ارشد فناوری اطلاعات می‌پرسند بازگشت سرمایه کجاست. در برخی موارد، ده‌ها میلیون، صدها میلیون یا میلیاردها دلار صرف زیرساخت‌های مرتبط با GPU می‌شود.»

لیمینگ گفت آنیل راویندراناث، مدیر ارشد فناوری Rapt AI، راه‌حل را پیدا کرد. و این شامل استقرار مانیتورها برای امکان مشاهده زیرساخت‌ها بود.

لیمینگ گفت: «ما احساس می‌کنیم که راه‌حل مناسب را در زمان مناسب داریم. ما پاییز گذشته از حالت مخفی خارج شدیم. ما در تعداد فزاینده‌ای از شرکت‌های Fortune 100 حضور داریم. دو شرکت در حال اجرای کد در میان ارائه‌دهندگان خدمات ابری هستند.»

او همچنین افزود: «ما شرکای استراتژیک داریم اما گفتگوهای ما با AMD بسیار خوب پیش رفت. آنها در حال ساخت GPUها و شتاب‌دهنده‌های هوش مصنوعی فوق‌العاده‌ای هستند. ما به خاطر قرار دادن حداکثر حجم کاری روی GPUها شناخته شده‌ایم. استنتاج در حال اوج‌گیری است. اکنون در مرحله تولید است. بارهای کاری هوش مصنوعی در حال انفجار هستند. دانشمندان داده آن‌ها با تمام سرعت در حال کار هستند. آن‌ها وحشت‌زده‌اند، به ابزار نیاز دارند، به کارایی نیاز دارند، به اتوماسیون نیاز دارند. این وضعیت فریاد می‌زند که به راه‌حل مناسب نیاز است. ناکارآمدی‌ها - ۳۰ درصد عدم استفاده از GPU. مشتریان انعطاف‌پذیری می‌خواهند. مشتریان بزرگ می‌پرسند آیا از AMD پشتیبانی می‌کنید.»

او گفت بهبودهایی که ممکن است نه ساعت طول بکشد، می‌تواند در سه دقیقه انجام شود. راویندراناث در یک نشست خبری گفت پلتفرم Rapt AI تا ۱۰ برابر ظرفیت اجرای مدل را در همان سطح هزینه محاسبات هوش مصنوعی، تا ۹۰٪ صرفه‌جویی در هزینه و بدون نیاز به دخالت انسان و بدون تغییر کد امکان‌پذیر می‌کند. برای بهره‌وری، این به معنای پایان انتظار برای محاسبات و زمان صرف شده برای تنظیم زیرساخت است.

لیمینگ گفت تکنیک‌های دیگر مدتی است که وجود دارند و کارساز نبوده‌اند. Run AI، یک رقیب، تا حدودی با آن‌ها همپوشانی رقابتی دارد. او گفت شرکتش در عرض چند دقیقه به جای چند ساعت، مشاهدات را انجام می‌دهد و سپس زیرساخت را بهینه می‌کند. راویندراناث گفت Run AI بیشتر شبیه یک زمان‌بندی‌کننده است اما Rapt AI خود را برای نتایج غیرقابل پیش‌بینی موقعیت‌یابی کرده و با آن سروکار دارد.

راویندراناث گفت: «ما مدل را اجرا می‌کنیم و آن را کشف می‌کنیم، و این یک مزیت بزرگ برای بارهای کاری استنتاج است. باید به طور خودکار اجرا شود.»

پردازنده گرافیکی AMD Instinct MI300X.
پردازنده گرافیکی AMD Instinct MI300X.

مزایا: هزینه‌های کمتر، استفاده بهتر از GPU

این شرکت‌ها گفتند که پردازنده‌های گرافیکی AMD Instinct، با ظرفیت حافظه پیشرو در صنعت، همراه با بهینه‌سازی هوشمند منابع Rapt، به تضمین حداکثر استفاده از GPU برای بارهای کاری هوش مصنوعی کمک می‌کند و به کاهش هزینه کل مالکیت (TCO) یاری می‌رساند.

پلتفرم Rapt مدیریت GPU را ساده می‌کند و نیاز دانشمندان داده به صرف زمان ارزشمند برای پیکربندی‌های زیرساختی مبتنی بر آزمون و خطا را از بین می‌برد. با بهینه‌سازی خودکار تخصیص منابع برای بارهای کاری خاص، آن‌ها را قادر می‌سازد تا به جای زیرساخت، بر نوآوری تمرکز کنند. این پلتفرم به طور یکپارچه از محیط‌های GPU متنوع (AMD و دیگران، چه در ابر، چه در محل یا هر دو) از طریق یک نمونه واحد پشتیبانی می‌کند و به تضمین حداکثر انعطاف‌پذیری زیرساخت کمک می‌کند.

راه‌حل ترکیبی به طور هوشمند تراکم کار (job density) و تخصیص منابع را در پردازنده‌های گرافیکی AMD Instinct بهینه می‌کند که منجر به عملکرد بهتر استنتاج و مقیاس‌پذیری برای استقرارهای هوش مصنوعی در مرحله تولید می‌شود. قابلیت‌های مقیاس‌پذیری خودکار Rapt همچنین به تضمین استفاده کارآمد از منابع بر اساس تقاضا کمک می‌کند، تأخیر را کاهش می‌دهد و کارایی هزینه را به حداکثر می‌رساند.

پلتفرم Rapt به صورت آماده به کار (out-of-the-box) با پردازنده‌های گرافیکی AMD Instinct کار می‌کند و به تضمین مزایای عملکردی فوری کمک می‌کند. همکاری مداوم بین Rapt و AMD بهینه‌سازی‌های بیشتری را در زمینه‌های هیجان‌انگیزی مانند زمان‌بندی GPU، استفاده از حافظه و موارد دیگر به دنبال خواهد داشت و به تضمین تجهیز مشتریان به زیرساخت هوش مصنوعی آماده برای آینده کمک می‌کند.

نگین الیور، معاون ارشد توسعه کسب‌وکار بخش GPU مرکز داده در AMD، در بیانیه‌ای گفت: «در AMD، ما متعهد به ارائه راه‌حل‌های هوش مصنوعی با کارایی بالا و مقیاس‌پذیر هستیم که سازمان‌ها را قادر می‌سازد تا پتانسیل کامل بارهای کاری هوش مصنوعی خود را آزاد کنند. همکاری ما با Rapt AI قابلیت‌های پیشرفته پردازنده‌های گرافیکی AMD Instinct را با اتوماسیون هوشمند بار کاری Rapt ترکیب می‌کند و مشتریان را قادر می‌سازد تا به کارایی، انعطاف‌پذیری و صرفه‌جویی در هزینه‌های بیشتری در سراسر زیرساخت هوش مصنوعی خود دست یابند.»