مدل‌های پایه دیگر نیازی به دستور یا برچسب ندارند

محققان EPFL یک چارچوب استنتاج مشترک برای انطباق کاملاً بدون نظارت با استفاده از تنظیم دقیق و یادگیری در متن معرفی می‌کنند

نمودار مدل
نمودار مدل

مدل‌های پایه دیگر نیازی به دستور یا برچسب ندارند: محققان EPFL یک چارچوب استنتاج مشترک برای انطباق کاملاً بدون نظارت با استفاده از تنظیم دقیق و یادگیری در متن معرفی می‌کنند

مدل‌های پایه (Foundation models)، که اغلب شبکه‌های عصبی عظیمی هستند که بر روی داده‌های متنی و تصویری گسترده آموزش داده شده‌اند، تغییر چشمگیری در نحوه برخورد سیستم‌های هوش مصنوعی با وظایف زبانی و بینایی ایجاد کرده‌اند. این مدل‌ها برای یک وظیفه واحد طراحی نشده‌اند، بلکه با استفاده از دانش پیش‌آموزشی خود، در طیف گسترده‌ای از وظایف تعمیم می‌یابند. پس از آموزش، آن‌ها می‌توانند پاسخ‌های منسجم تولید کنند، تصاویر را طبقه‌بندی کنند یا مسائل را بدون نیاز به آموزش وظیفه‌محور جدید حل کنند. مقیاس‌پذیری و استفاده مجدد آن‌ها در حوزه‌های مختلف، آن‌ها را به سنگ بنای توسعه هوش مصنوعی تبدیل کرده است.

با وجود قابلیت‌های گسترده‌شان، یک مسئله مداوم در نحوه انطباق این مدل‌ها برای وظایف جدید و دیده‌نشده نهفته است. در بیشتر سناریوها، دستیابی به عملکرد قوی مستلزم ارائه دستورهای دست‌ساز یا نمونه‌های برچسب‌گذاری‌شده است که مدل را در نحوه رفتار راهنمایی می‌کند. با این حال، این فرآیند سربار ایجاد می‌کند، زیرا ساخت دستورها شامل آزمون و خطا است و جمع‌آوری نمونه‌های برچسب‌گذاری‌شده می‌تواند پرهزینه و زمان‌بر باشد. علاوه بر این، در کاربردهای دنیای واقعی، چنین داده‌های پشتیبانی ممکن است همیشه به راحتی در دسترس نباشند و قابلیت استفاده از مدل‌های پایه را در تنظیمات صفر-شات محدود کند.

تصویرسازی چارچوب
تصویرسازی چارچوب

محققان مؤسسه فناوری فدرال سوئیس لوزان (EPFL) یک چارچوب استنتاج مشترک معرفی کردند که از انطباق بدون نظارت پشتیبانی می‌کند. این چارچوب مدل‌های پایه را قادر می‌سازد تا پیش‌بینی‌های هماهنگ را بر روی چندین ورودی بدون نیاز به داده‌های حقیقت زمینی یا دستورهای دستی انجام دهند. تیم تحقیقاتی دو تکنیک خاص را در این چارچوب ارائه کرد: تنظیم دقیق بدون نظارت و یادگیری در متن بدون نظارت. این روش‌ها به مدل‌ها، از جمله مدل‌های وزن‌بسته مانند GPT-4، اجازه می‌دهند تا دقت را بدون راهنمایی خارجی بهبود بخشند.

نمودار عملکرد
نمودار عملکرد

این کار یک تغییر معنادار در نحوه انطباق مدل‌های پایه را نشان می‌دهد. محققان با معرفی یک استراتژی خودنظارتی قوی و مقیاس‌پذیر، با موفقیت به محدودیت اصلی - تکیه بر داده‌های برچسب‌گذاری‌شده و پیکربندی دستی - پرداختند. چارچوب استنتاج مشترک آن‌ها یک رویکرد عملی و تعمیم‌پذیر است که مرزهای یادگیری بدون نظارت را برای مدل‌های هوش مصنوعی در مقیاس بزرگ دوباره تعریف می‌کند.