تصویر: VentureBeat ساخته شده با Midjourney
تصویر: VentureBeat ساخته شده با Midjourney

کمتر، بیشتر است: چگونه «زنجیره پیش‌نویس» می‌تواند هزینه‌های هوش مصنوعی را تا 90٪ کاهش داده و عملکرد را بهبود بخشد

تیمی از محققان در

Zoom Communications
یک تکنیک پیشگامانه توسعه داده‌اند که می‌تواند به طور چشمگیری هزینه و منابع محاسباتی مورد نیاز برای سیستم‌های هوش مصنوعی را برای مقابله با مسائل استدلالی پیچیده کاهش دهد و به طور بالقوه نحوه استقرار هوش مصنوعی در مقیاس بزرگ توسط شرکت‌ها را تغییر دهد.

این روش که

زنجیره پیش‌نویس
(CoD) نامیده می‌شود، مدل‌های زبانی بزرگ (LLM) را قادر می‌سازد تا مسائل را با حداقل کلمات حل کنند - با استفاده از تنها 7.6٪ از متن مورد نیاز روش‌های فعلی در حالی که دقت را حفظ یا حتی بهبود می‌بخشند. یافته‌ها هفته گذشته در مقاله‌ای در مخزن تحقیقاتی arXiv منتشر شد.

نویسندگان، به رهبری سیلی شو، محقق Zoom، می‌نویسند: «با کاهش پرحرفی و تمرکز بر بینش‌های حیاتی، CoD از نظر دقت با CoT (زنجیره تفکر) مطابقت دارد یا از آن پیشی می‌گیرد، در حالی که تنها از 7.6٪ از توکن‌ها استفاده می‌کند و به طور قابل توجهی هزینه و تأخیر را در کارهای استدلالی مختلف کاهش می‌دهد.»

زنجیره پیش‌نویس (قرمز) دقت زنجیره تفکر (زرد) را حفظ می‌کند یا از آن فراتر می‌رود، در حالی که از توکن‌های بسیار کمتری در چهار کار استدلالی استفاده می‌کند، که نشان می‌دهد چگونه استدلال مختصر هوش مصنوعی می‌تواند هزینه‌ها را بدون قربانی کردن عملکرد کاهش دهد.
زنجیره پیش‌نویس (قرمز) دقت زنجیره تفکر (زرد) را حفظ می‌کند یا از آن فراتر می‌رود، در حالی که از توکن‌های بسیار کمتری در چهار کار استدلالی استفاده می‌کند، که نشان می‌دهد چگونه استدلال مختصر هوش مصنوعی می‌تواند هزینه‌ها را بدون قربانی کردن عملکرد کاهش دهد. (منبع: arxiv.org)

چگونه «کمتر بیشتر است» استدلال هوش مصنوعی را بدون قربانی کردن دقت متحول می‌کند

COD از نحوه حل مسائل پیچیده توسط انسان‌ها الهام می‌گیرد. به جای بیان تمام جزئیات هنگام کار بر روی یک مسئله ریاضی یا پازل منطقی، افراد معمولاً فقط اطلاعات ضروری را به صورت خلاصه یادداشت می‌کنند.

محققان توضیح می‌دهند: «هنگام حل وظایف پیچیده - چه مسائل ریاضی، چه نوشتن مقالات یا کدنویسی - ما اغلب فقط قطعات مهم اطلاعاتی را یادداشت می‌کنیم که به ما در پیشرفت کمک می‌کنند. با تقلید از این رفتار، LLMها می‌توانند بدون هزینه استدلال پرحرف، بر پیشرفت به سمت راه‌حل‌ها تمرکز کنند.»

این تیم رویکرد خود را روی معیارهای متعددی آزمایش کردند، از جمله استدلال حسابی (GSM8k)، استدلال عقل سلیم (درک تاریخ و درک ورزش) و استدلال نمادین (وظایف پرتاب سکه).

در یک مثال قابل توجه که در آن Claude 3.5 Sonnet سؤالات مربوط به ورزش را پردازش کرد، رویکرد COD میانگین خروجی را از 189.4 توکن به تنها 14.3 توکن کاهش داد - 92.4٪ کاهش - در حالی که به طور همزمان دقت را از 93.2٪ به 97.3٪ بهبود بخشید.

کاهش هزینه‌های هوش مصنوعی سازمانی: توجیه اقتصادی برای استدلال ماشینی مختصر

Ajith Vallath Prabhakar، محقق هوش مصنوعی، در تحلیلی از این مقاله می‌نویسد: «برای شرکتی که ماهانه 1 میلیون پرسش استدلالی را پردازش می‌کند، CoD می‌تواند هزینه‌ها را از 3800 دلار (CoT) به 760 دلار کاهش دهد و بیش از 3000 دلار در ماه صرفه‌جویی کند.»

این تحقیق در زمان حساسی برای استقرار هوش مصنوعی سازمانی انجام می‌شود. با افزایش ادغام سیستم‌های پیچیده هوش مصنوعی در عملیات شرکت‌ها، هزینه‌های محاسباتی و زمان پاسخگویی به عنوان موانع مهمی برای پذیرش گسترده ظاهر شده‌اند.

تکنیک‌های استدلالی پیشرفته کنونی مانند (CoT)، که در سال 2022 معرفی شد، توانایی هوش مصنوعی را در حل مسائل پیچیده با تقسیم آن‌ها به استدلال گام به گام به طور چشمگیری بهبود بخشیده‌اند. اما این رویکرد توضیحات طولانی ایجاد می‌کند که منابع محاسباتی قابل توجهی را مصرف می‌کند و تأخیر در پاسخگویی را افزایش می‌دهد.

Prabhakar می‌نویسد: «ماهیت پرحرف درخواست CoT منجر به سربار محاسباتی قابل توجه، افزایش تأخیر و هزینه‌های عملیاتی بالاتر می‌شود.»

پیاده‌سازی کارایی هوش مصنوعی: عدم نیاز به آموزش مجدد برای تأثیر فوری بر کسب‌وکار

آنچه COD را به ویژه برای شرکت‌ها قابل توجه می‌کند، سادگی پیاده‌سازی آن است. برخلاف بسیاری از پیشرفت‌های هوش مصنوعی که نیاز به آموزش مجدد مدل یا تغییرات معماری پرهزینه دارند، CoD را می‌توان بلافاصله با مدل‌های موجود از طریق یک اصلاح ساده در درخواست مستقر کرد.

Prabhakar توضیح می‌دهد: «سازمان‌هایی که قبلاً از CoT استفاده می‌کنند می‌توانند با یک اصلاح ساده در درخواست به CoD تغییر کنند.»

این تکنیک می‌تواند به ویژه برای برنامه‌های کاربردی حساس به تأخیر مانند پشتیبانی مشتری در زمان واقعی، هوش مصنوعی موبایل، ابزارهای آموزشی و خدمات مالی ارزشمند باشد، جایی که حتی تأخیرهای کوچک می‌تواند به طور قابل توجهی بر تجربه کاربر تأثیر بگذارد.

با این حال، کارشناسان صنعت پیشنهاد می‌کنند که پیامدها فراتر از صرفه‌جویی در هزینه است. با در دسترس و مقرون به صرفه کردن استدلال پیشرفته هوش مصنوعی، COD می‌تواند دسترسی به قابلیت‌های پیچیده هوش مصنوعی را برای سازمان‌های کوچک‌تر و محیط‌های محدود از نظر منابع دموکراتیک کند.

همانطور که سیستم‌های هوش مصنوعی به تکامل خود ادامه می‌دهند، تکنیک‌هایی مانند COD بر تأکید روزافزون بر کارایی در کنار توانایی خام تأکید می‌کنند. برای شرکت‌هایی که در حال حرکت در چشم‌انداز هوش مصنوعی به سرعت در حال تغییر هستند، چنین بهینه‌سازی‌هایی می‌تواند به اندازه بهبود در مدل‌های زیربنایی ارزشمند باشد.

Prabhakar نتیجه می‌گیرد: «همانطور که مدل‌های هوش مصنوعی به تکامل خود ادامه می‌دهند، بهینه‌سازی کارایی استدلال به اندازه بهبود قابلیت‌های خام آن‌ها حیاتی خواهد بود.»

کد تحقیق و داده‌ها به صورت

عمومی در GitHub در دسترس قرار گرفته‌اند
و به سازمان‌ها این امکان را می‌دهد تا این رویکرد را با سیستم‌های هوش مصنوعی خود پیاده‌سازی و آزمایش کنند.