شرکت Rapt AI، ارائهدهنده اتوماسیون بار کاری هوش مصنوعی مبتنی بر هوش مصنوعی برای پردازندههای گرافیکی (GPU) و شتابدهندههای هوش مصنوعی، با AMD برای بهبود زیرساخت هوش مصنوعی همکاری کرده است.
هدف این همکاری استراتژیک بلندمدت، بهبود مدیریت بار کاری و عملکرد استنتاج و آموزش هوش مصنوعی در پردازندههای گرافیکی AMD Instinct است و به مشتریان راهحلی مقیاسپذیر و مقرونبهصرفه برای استقرار برنامههای کاربردی هوش مصنوعی ارائه میدهد.
با شتاب گرفتن پذیرش هوش مصنوعی، سازمانها با چالشهایی مانند تخصیص منابع، گلوگاههای عملکردی و مدیریت پیچیده GPU دست و پنجه نرم میکنند.
با ادغام پلتفرم اتوماسیون هوشمند بار کاری Rapt با پردازندههای گرافیکی سری AMD Instinct MI300X، MI325X و سری آتی MI350، این همکاری راهحلی مقیاسپذیر، با کارایی بالا و مقرونبهصرفه ارائه میدهد که مشتریان را قادر میسازد تا کارایی استنتاج و آموزش هوش مصنوعی را در زیرساختهای محلی (on-premises) و چندابری (multi-cloud) به حداکثر برسانند.
راهحلی کارآمدتر
چارلی لیمینگ، مدیرعامل Rapt AI، در یک نشست خبری گفت: «مدلهای هوش مصنوعی که امروزه میبینیم بسیار بزرگ و مهمتر از همه، بسیار پویا و غیرقابل پیشبینی هستند. ابزارهای قدیمی برای بهینهسازی اصلاً مناسب نیستند. ما این پویاییها را مشاهده کردیم. شرکتها پول زیادی خرج میکنند. استعدادهای جدیدی در زمینه هوش مصنوعی استخدام میکنند. این یکی از آن فناوریهای تحولآفرین است. ما در سناریویی هستیم که مدیران مالی و مدیران ارشد فناوری اطلاعات میپرسند بازگشت سرمایه کجاست. در برخی موارد، دهها میلیون، صدها میلیون یا میلیاردها دلار صرف زیرساختهای مرتبط با GPU میشود.»
لیمینگ گفت آنیل راویندراناث، مدیر ارشد فناوری Rapt AI، راهحل را پیدا کرد. و این شامل استقرار مانیتورها برای امکان مشاهده زیرساختها بود.
لیمینگ گفت: «ما احساس میکنیم که راهحل مناسب را در زمان مناسب داریم. ما پاییز گذشته از حالت مخفی خارج شدیم. ما در تعداد فزایندهای از شرکتهای Fortune 100 حضور داریم. دو شرکت در حال اجرای کد در میان ارائهدهندگان خدمات ابری هستند.»
او همچنین افزود: «ما شرکای استراتژیک داریم اما گفتگوهای ما با AMD بسیار خوب پیش رفت. آنها در حال ساخت GPUها و شتابدهندههای هوش مصنوعی فوقالعادهای هستند. ما به خاطر قرار دادن حداکثر حجم کاری روی GPUها شناخته شدهایم. استنتاج در حال اوجگیری است. اکنون در مرحله تولید است. بارهای کاری هوش مصنوعی در حال انفجار هستند. دانشمندان داده آنها با تمام سرعت در حال کار هستند. آنها وحشتزدهاند، به ابزار نیاز دارند، به کارایی نیاز دارند، به اتوماسیون نیاز دارند. این وضعیت فریاد میزند که به راهحل مناسب نیاز است. ناکارآمدیها - ۳۰ درصد عدم استفاده از GPU. مشتریان انعطافپذیری میخواهند. مشتریان بزرگ میپرسند آیا از AMD پشتیبانی میکنید.»
او گفت بهبودهایی که ممکن است نه ساعت طول بکشد، میتواند در سه دقیقه انجام شود. راویندراناث در یک نشست خبری گفت پلتفرم Rapt AI تا ۱۰ برابر ظرفیت اجرای مدل را در همان سطح هزینه محاسبات هوش مصنوعی، تا ۹۰٪ صرفهجویی در هزینه و بدون نیاز به دخالت انسان و بدون تغییر کد امکانپذیر میکند. برای بهرهوری، این به معنای پایان انتظار برای محاسبات و زمان صرف شده برای تنظیم زیرساخت است.
لیمینگ گفت تکنیکهای دیگر مدتی است که وجود دارند و کارساز نبودهاند. Run AI، یک رقیب، تا حدودی با آنها همپوشانی رقابتی دارد. او گفت شرکتش در عرض چند دقیقه به جای چند ساعت، مشاهدات را انجام میدهد و سپس زیرساخت را بهینه میکند. راویندراناث گفت Run AI بیشتر شبیه یک زمانبندیکننده است اما Rapt AI خود را برای نتایج غیرقابل پیشبینی موقعیتیابی کرده و با آن سروکار دارد.
راویندراناث گفت: «ما مدل را اجرا میکنیم و آن را کشف میکنیم، و این یک مزیت بزرگ برای بارهای کاری استنتاج است. باید به طور خودکار اجرا شود.»
مزایا: هزینههای کمتر، استفاده بهتر از GPU
این شرکتها گفتند که پردازندههای گرافیکی AMD Instinct، با ظرفیت حافظه پیشرو در صنعت، همراه با بهینهسازی هوشمند منابع Rapt، به تضمین حداکثر استفاده از GPU برای بارهای کاری هوش مصنوعی کمک میکند و به کاهش هزینه کل مالکیت (TCO) یاری میرساند.
پلتفرم Rapt مدیریت GPU را ساده میکند و نیاز دانشمندان داده به صرف زمان ارزشمند برای پیکربندیهای زیرساختی مبتنی بر آزمون و خطا را از بین میبرد. با بهینهسازی خودکار تخصیص منابع برای بارهای کاری خاص، آنها را قادر میسازد تا به جای زیرساخت، بر نوآوری تمرکز کنند. این پلتفرم به طور یکپارچه از محیطهای GPU متنوع (AMD و دیگران، چه در ابر، چه در محل یا هر دو) از طریق یک نمونه واحد پشتیبانی میکند و به تضمین حداکثر انعطافپذیری زیرساخت کمک میکند.
راهحل ترکیبی به طور هوشمند تراکم کار (job density) و تخصیص منابع را در پردازندههای گرافیکی AMD Instinct بهینه میکند که منجر به عملکرد بهتر استنتاج و مقیاسپذیری برای استقرارهای هوش مصنوعی در مرحله تولید میشود. قابلیتهای مقیاسپذیری خودکار Rapt همچنین به تضمین استفاده کارآمد از منابع بر اساس تقاضا کمک میکند، تأخیر را کاهش میدهد و کارایی هزینه را به حداکثر میرساند.
پلتفرم Rapt به صورت آماده به کار (out-of-the-box) با پردازندههای گرافیکی AMD Instinct کار میکند و به تضمین مزایای عملکردی فوری کمک میکند. همکاری مداوم بین Rapt و AMD بهینهسازیهای بیشتری را در زمینههای هیجانانگیزی مانند زمانبندی GPU، استفاده از حافظه و موارد دیگر به دنبال خواهد داشت و به تضمین تجهیز مشتریان به زیرساخت هوش مصنوعی آماده برای آینده کمک میکند.
نگین الیور، معاون ارشد توسعه کسبوکار بخش GPU مرکز داده در AMD، در بیانیهای گفت: «در AMD، ما متعهد به ارائه راهحلهای هوش مصنوعی با کارایی بالا و مقیاسپذیر هستیم که سازمانها را قادر میسازد تا پتانسیل کامل بارهای کاری هوش مصنوعی خود را آزاد کنند. همکاری ما با Rapt AI قابلیتهای پیشرفته پردازندههای گرافیکی AMD Instinct را با اتوماسیون هوشمند بار کاری Rapt ترکیب میکند و مشتریان را قادر میسازد تا به کارایی، انعطافپذیری و صرفهجویی در هزینههای بیشتری در سراسر زیرساخت هوش مصنوعی خود دست یابند.»