مهندس هوش مصنوعی CUDA ساکانا تا ۱۰۰ برابر سرعت بیشتری نسبت به PyTorch ارائه می‌دهد

منتشر شده در تاریخ February 20, 2025

در اخبار هوش مصنوعی

مهندس هوش مصنوعی CUDA با موفقیت بیش از ۲۳۰ عملیات از ۲۵۰ عملیات PyTorch ارزیابی شده را ترجمه کرده است.

نویسنده: Siddharth Jindal

استارتاپ هوش مصنوعی ژاپنی ساکانا هوش مصنوعی، مهندس هوش مصنوعی CUDA را معرفی کرده است، یک چارچوب عامل‌محور که کشف و بهینه‌سازی کرنل‌های CUDA را برای بهبود عملکرد GPU به طور خودکار انجام می‌دهد.

این شرکت ادعا می‌کند که این چارچوب می‌تواند کرنل‌های CUDA را با افزایش سرعت ۱۰ تا ۱۰۰ برابری نسبت به عملیات رایج PyTorch و تا پنج برابر سریع‌تر از کرنل‌های CUDA موجود در تولید، تولید کند.

CUDA یک رابط برنامه‌نویسی سطح پایین است که دسترسی مستقیم به GPUهای NVIDIA را برای محاسبات موازی فراهم می‌کند. بهینه‌سازی دستی کرنل‌های CUDA نیازمند تخصص قابل توجهی در معماری GPU است. سیستم جدید ساکانا هوش مصنوعی از LLMها و تکنیک‌های بهینه‌سازی تکاملی برای خودکارسازی این فرآیند استفاده می‌کند و توسعه کرنل CUDA با عملکرد بالا را در دسترس‌تر می‌سازد.

جیم فن، مدیر ارشد تحقیقات و سرپرست هوش مصنوعی در NVIDIA گفت: «جذاب‌ترین عامل کدنویسی مستقل که اخیراً دیده‌ام: استفاده از هوش مصنوعی برای نوشتن کرنل‌های CUDA بهتر برای تسریع هوش مصنوعی. AutoML دوباره برگشته است!» وی افزود که مؤثرترین راه برای استفاده از منابع محاسباتی، ارتقای بهره‌وری آینده همان محاسبات است.

به گفته ساکانا هوش مصنوعی، مهندس هوش مصنوعی CUDA از طریق یک خط لوله چند مرحله‌ای، کد استاندارد PyTorch را به کرنل‌های CUDA بهینه شده تبدیل می‌کند. در ابتدا، عملیات PyTorch را به کرنل‌های CUDA ترجمه می‌کند، که اغلب زمان اجرا را بدون تنظیم صریح بهبود می‌بخشد. سپس سیستم از بهینه‌سازی تکاملی استفاده می‌کند و از استراتژی‌هایی مانند عملیات «تقاطع» و یک «آرشیو نوآوری» برای بهبود عملکرد استفاده می‌کند.

این شرکت گفت: «رویکرد ما قادر است به طور مؤثر عملیات مختلف کرنل را ادغام کند و می‌تواند از چندین عملیات تسریع شده موجود بهتر عمل کند.» این چارچوب بر اساس تحقیقات قبلی این شرکت با دانشمند هوش مصنوعی ساخته شده است، که به بررسی خودکارسازی تحقیقات هوش مصنوعی پرداخت. مهندس هوش مصنوعی CUDA این مفهوم را به بهینه‌سازی کرنل گسترش می‌دهد و از هوش مصنوعی برای بهبود عملکرد هوش مصنوعی استفاده می‌کند.

ساکانا هوش مصنوعی گزارش داد که مهندس هوش مصنوعی CUDA با موفقیت بیش از ۲۳۰ عملیات از ۲۵۰ عملیات PyTorch ارزیابی شده را ترجمه کرده است. همچنین بیش از ۳۰۰۰۰ کرنل CUDA تولید کرده است که صحت بیش از ۱۷۰۰۰ مورد از آنها تأیید شده است. تقریباً ۵۰٪ از این کرنل‌ها از پیاده‌سازی‌های بومی PyTorch بهتر عمل می‌کنند.

این شرکت مجموعه داده‌ها را تحت مجوز CC-By-4.0 در Hugging Face در دسترس قرار داده است. این شامل پیاده‌سازی‌های مرجع، داده‌های پروفایل و مقایسه‌های عملکرد در برابر زمان‌های اجرای بومی PyTorch است.

ساکانا هوش مصنوعی همچنین یک وب‌سایت تعاملی راه‌اندازی کرده است که در آن کاربران می‌توانند مجموعه داده‌ها و رتبه‌بندی‌های برتر کرنل‌های بهینه شده را بررسی کنند. این پلتفرم دسترسی به کد کرنل، معیارهای عملکرد و آزمایش‌های بهینه‌سازی مرتبط را فراهم می‌کند.