منتشر شده در تاریخ February 20, 2025
در اخبار هوش مصنوعی
مهندس هوش مصنوعی CUDA با موفقیت بیش از ۲۳۰ عملیات از ۲۵۰ عملیات PyTorch ارزیابی شده را ترجمه کرده است.
نویسنده: Siddharth Jindal
استارتاپ هوش مصنوعی ژاپنی ساکانا هوش مصنوعی، مهندس هوش مصنوعی CUDA را معرفی کرده است، یک چارچوب عاملمحور که کشف و بهینهسازی کرنلهای CUDA را برای بهبود عملکرد GPU به طور خودکار انجام میدهد.
این شرکت ادعا میکند که این چارچوب میتواند کرنلهای CUDA را با افزایش سرعت ۱۰ تا ۱۰۰ برابری نسبت به عملیات رایج PyTorch و تا پنج برابر سریعتر از کرنلهای CUDA موجود در تولید، تولید کند.
CUDA یک رابط برنامهنویسی سطح پایین است که دسترسی مستقیم به GPUهای NVIDIA را برای محاسبات موازی فراهم میکند. بهینهسازی دستی کرنلهای CUDA نیازمند تخصص قابل توجهی در معماری GPU است. سیستم جدید ساکانا هوش مصنوعی از LLMها و تکنیکهای بهینهسازی تکاملی برای خودکارسازی این فرآیند استفاده میکند و توسعه کرنل CUDA با عملکرد بالا را در دسترستر میسازد.
جیم فن، مدیر ارشد تحقیقات و سرپرست هوش مصنوعی در NVIDIA گفت: «جذابترین عامل کدنویسی مستقل که اخیراً دیدهام: استفاده از هوش مصنوعی برای نوشتن کرنلهای CUDA بهتر برای تسریع هوش مصنوعی. AutoML دوباره برگشته است!» وی افزود که مؤثرترین راه برای استفاده از منابع محاسباتی، ارتقای بهرهوری آینده همان محاسبات است.
به گفته ساکانا هوش مصنوعی، مهندس هوش مصنوعی CUDA از طریق یک خط لوله چند مرحلهای، کد استاندارد PyTorch را به کرنلهای CUDA بهینه شده تبدیل میکند. در ابتدا، عملیات PyTorch را به کرنلهای CUDA ترجمه میکند، که اغلب زمان اجرا را بدون تنظیم صریح بهبود میبخشد. سپس سیستم از بهینهسازی تکاملی استفاده میکند و از استراتژیهایی مانند عملیات «تقاطع» و یک «آرشیو نوآوری» برای بهبود عملکرد استفاده میکند.
این شرکت گفت: «رویکرد ما قادر است به طور مؤثر عملیات مختلف کرنل را ادغام کند و میتواند از چندین عملیات تسریع شده موجود بهتر عمل کند.» این چارچوب بر اساس تحقیقات قبلی این شرکت با دانشمند هوش مصنوعی ساخته شده است، که به بررسی خودکارسازی تحقیقات هوش مصنوعی پرداخت. مهندس هوش مصنوعی CUDA این مفهوم را به بهینهسازی کرنل گسترش میدهد و از هوش مصنوعی برای بهبود عملکرد هوش مصنوعی استفاده میکند.
ساکانا هوش مصنوعی گزارش داد که مهندس هوش مصنوعی CUDA با موفقیت بیش از ۲۳۰ عملیات از ۲۵۰ عملیات PyTorch ارزیابی شده را ترجمه کرده است. همچنین بیش از ۳۰۰۰۰ کرنل CUDA تولید کرده است که صحت بیش از ۱۷۰۰۰ مورد از آنها تأیید شده است. تقریباً ۵۰٪ از این کرنلها از پیادهسازیهای بومی PyTorch بهتر عمل میکنند.
این شرکت مجموعه دادهها را تحت مجوز CC-By-4.0 در Hugging Face در دسترس قرار داده است. این شامل پیادهسازیهای مرجع، دادههای پروفایل و مقایسههای عملکرد در برابر زمانهای اجرای بومی PyTorch است.
ساکانا هوش مصنوعی همچنین یک وبسایت تعاملی راهاندازی کرده است که در آن کاربران میتوانند مجموعه دادهها و رتبهبندیهای برتر کرنلهای بهینه شده را بررسی کنند. این پلتفرم دسترسی به کد کرنل، معیارهای عملکرد و آزمایشهای بهینهسازی مرتبط را فراهم میکند.