مقاله هوش مصنوعی دانشگاه کلمبیا، Manify را معرفی می‌کند: یک کتابخانه پایتون برای یادگیری بازنمایی غیراقلیدسی

نمودار یادگیری ماشین مبتنی بر مانیفولد
نمودار یادگیری ماشین مبتنی بر مانیفولد

در سال‌های اخیر، یادگیری ماشین فراتر از فضاهای اقلیدسی سنتی گسترش یافته و بازنمایی‌ها را در ساختارهای هندسی پیچیده‌تر بررسی می‌کند. یادگیری بازنمایی غیراقلیدسی یک حوزه رو به رشد است که به دنبال ثبت ویژگی‌های هندسی زیربنایی داده‌ها با جاسازی آن‌ها در فضاهای هذلولی، کروی یا فضاهای حاصل‌ضرب با انحنای مختلط است. این رویکردها به ویژه در مدل‌سازی داده‌های سلسله مراتبی، ساختاریافته یا شبکه‌ای کارآمدتر از جاسازی‌های اقلیدسی مفید بوده‌اند. این حوزه شاهد پیشرفت‌های چشمگیری با ابزارها و الگوریتم‌های جدید برای تسهیل این بازنمایی‌های پیچیده بوده است.

یک چالش مهم در این زمینه، فقدان یک چارچوب متحد است که رویکردهای مختلف به یادگیری بازنمایی غیراقلیدسی را ادغام کند. روش‌های فعلی اغلب در بسته‌های نرم‌افزاری متعددی پراکنده هستند و ناکارآمدی‌هایی را در پیاده‌سازی ایجاد می‌کنند. بسیاری از ابزارهای موجود به انواع خاصی از فضاهای غیراقلیدسی پاسخ می‌دهند و کاربرد گسترده‌تر آن‌ها را محدود می‌کنند. محققان به یک کتابخانه جامع و در دسترس نیاز دارند که جاسازی، طبقه‌بندی و رگرسیون یکپارچه را در عین حفظ سازگاری با چارچوب‌های یادگیری ماشین تثبیت‌شده امکان‌پذیر کند. رفع این شکاف برای پیشبرد تحقیقات و کاربردهای یادگیری ماشین غیراقلیدسی بسیار مهم است.

معماری Manify
معماری Manify

یک تیم تحقیقاتی از دانشگاه کلمبیا Manify را معرفی کرد، یک کتابخانه پایتون متن‌باز که برای رفع محدودیت‌های ابزارهای یادگیری بازنمایی غیراقلیدسی موجود طراحی شده است. Manify با گنجاندن جاسازی‌های با انحنای مختلط و تکنیک‌های یادگیری مبتنی بر مانیفولد در یک بسته واحد، فراتر از روش‌های فعلی گسترش می‌یابد. این کتابخانه بر اساس Geoopt ساخته شده است و با امکان یادگیری بازنمایی‌ها در محصولات مانیفولدهای هذلولی، کروی و اقلیدسی، قابلیت‌های آن را افزایش می‌دهد. این کتابخانه وظایف طبقه‌بندی و رگرسیون را تسهیل می‌کند و در عین حال تخمین انحنای مانیفولد را امکان‌پذیر می‌کند. Manify با تجمیع تکنیک‌های یادگیری غیراقلیدسی متعدد در یک چارچوب ساختاریافته، یک راه حل قوی برای محققانی که با داده‌هایی کار می‌کنند که به طور طبیعی در فضاهای غیراقلیدسی وجود دارند، ارائه می‌دهد.

Manify شامل سه عملکرد اصلی است: جاسازی نمودارها یا ماتریس‌های فاصله در مانیفولدهای محصول، آموزش پیش‌بینی‌کننده‌ها برای داده‌های با مقدار مانیفولد و تخمین انحنای مجموعه داده. این کتابخانه چندین روش جاسازی از جمله یادگیری مختصات، شبکه‌های عصبی سیامی و خودرمزگذارهای واریانس را ادغام می‌کند و مزایای متمایزی را در کاربردهای مختلف ارائه می‌دهد. علاوه بر این، از طبقه‌بندی‌کننده‌های مختلفی مانند درخت‌های تصمیم، پرسشگرها و ماشین‌های بردار پشتیبان که برای کار با داده‌های غیراقلیدسی تطبیق داده شده‌اند، پشتیبانی می‌کند. Manify همچنین دارای ابزارهای تخصصی برای اندازه‌گیری انحنا است که به کاربران در تعیین مناسب‌ترین هندسه مانیفولد برای مجموعه‌داده‌هایشان کمک می‌کند. این قابلیت‌ها آن را به یک کتابخانه همه‌کاره و قدرتمند برای محققانی که تکنیک‌های یادگیری غیراقلیدسی را بررسی می‌کنند، تبدیل می‌کند.

عملکرد Manify در چندین وظیفه یادگیری ماشین ارزیابی شده است که بهبودهای قابل توجهی را در کیفیت جاسازی و دقت پیش‌بینی نشان می‌دهد. توانایی کتابخانه در مدل‌سازی انحنای ناهمگن در یک چارچوب واحد، اعوجاج متریک را در مقایسه با روش‌های اقلیدسی کاهش داده است. نتایج نشان می‌دهد که جاسازی‌های تولید شده با استفاده از Manify وفاداری ساختاری برتری را نشان می‌دهند و فواصل را دقیق‌تر از تکنیک‌های سنتی حفظ می‌کنند. این کتابخانه همچنین کارایی محاسباتی را نشان داده است و زمان‌های آموزش با روش‌های موجود مبتنی بر اقلیدس قابل مقایسه است، با وجود افزایش پیچیدگی بازنمایی‌های غیراقلیدسی. معیارهای عملکرد نشان می‌دهند که Manify به طور متوسط ​​حدود 15٪ بهبود در دقت طبقه‌بندی نسبت به جاسازی‌های اقلیدسی دست می‌یابد و اثربخشی آن را در وظایف یادگیری مبتنی بر مانیفولد نشان می‌دهد.

Manify نشان‌دهنده یک پیشرفت بزرگ در یادگیری بازنمایی غیراقلیدسی است، محدودیت‌های ابزارهای موجود را برطرف می‌کند و مدل‌سازی دقیق‌تری از ساختارهای داده پیچیده را امکان‌پذیر می‌کند. این کتابخانه با ارائه یک چارچوب متن‌باز و یکپارچه، پذیرش تکنیک‌های یادگیری مبتنی بر مانیفولد را برای محققان و متخصصان ساده می‌کند. معرفی Manify شکاف بین پیشرفت‌های نظری و پیاده‌سازی عملی را پر کرده است و روش‌های یادگیری غیراقلیدسی را برای جامعه علمی گسترده‌تر در دسترس قرار داده است. پیشرفت‌های آینده می‌تواند قابلیت‌های آن را بیشتر بهینه کند و نقش آن را به عنوان یک منبع کلیدی در تحقیقات یادگیری ماشین تثبیت کند.