نمایی از یک مدل یادگیری ماشین
نمایی از یک مدل یادگیری ماشین

ایجاد مدل‌های یادگیری ماشین قابل اعتماد: درس‌هایی از برایان لوسنا

مدل‌سازی پیش‌بینی‌کننده (Predictive modeling) در قلب برنامه‌های کاربردی مدرن یادگیری ماشین قرار دارد. از تشخیص تقلب گرفته تا پیش‌بینی مالی، توانایی ارائه پیش‌بینی‌های دقیق و قابل اعتماد می‌تواند موفقیت یک کسب‌وکار داده‌محور را تعیین کند. اما چگونه متخصصان یادگیری ماشین می‌توانند قابلیت اطمینان مدل‌های خود را بهبود بخشند، به ویژه هنگام کار با داده‌های جدولی؟ در یکی از قسمت‌های اخیر پادکست Ai X از ODSC، برایان لوسنا (Brian Lucena)، دانشمند داده برجسته و مربی، و مدیر Numeristical، بینش‌های خود را در مورد تقویت گرادیان (gradient boosting)، تخمین عدم قطعیت (uncertainty estimation) و کالیبراسیون مدل (model calibration) به اشتراک گذاشت - موضوعاتی که برای ساخت سیستم‌های یادگیری ماشین قوی بسیار مهم هستند.

شما می‌توانید پادکست کامل را در Spotify، Apple و SoundCloud گوش دهید.

برایان لوسنا
برایان لوسنا

برایان لوسنا بحث را با توصیه‌هایی برای متخصصان یادگیری ماشین که در حال پیمایش در چشم‌انداز هوش مصنوعی به سرعت در حال تحول هستند، به پایان رساند. در حالی که هوش مصنوعی مولد (generative AI) و مدل‌های زبانی بزرگ (LLMs) توجه‌ها را به خود جلب می‌کنند، بسیاری از برنامه‌های کاربردی یادگیری ماشین حیاتی کسب‌وکار هنوز به تکنیک‌های مدل‌سازی پیش‌بینی‌کننده سنتی متکی هستند.

برای دانشمندان و مهندسان داده، نکات کلیدی عبارتند از:

تقویت گرادیان همچنان یک نیروگاه برای داده‌های ساختاریافته است و نباید به نفع یادگیری عمیق نادیده گرفته شود.

تخمین عدم قطعیت بینش‌های عمیق‌تری را در مورد پیش‌بینی‌های مدل ارائه می‌دهد و امکان تصمیم‌گیری آگاهانه‌تر را فراهم می‌کند.

کالیبراسیون برای معنادار کردن امتیازهای احتمال بسیار مهم است و باید یک گام استاندارد در استقرار مدل باشد.

نظارت بر رانش مدل قابلیت اطمینان بلندمدت را تضمین می‌کند و مدل‌ها را با شرایط متغیر دنیای واقعی هماهنگ نگه می‌دارد.

از آنجایی که کسب‌وکارها به طور فزاینده‌ای به یادگیری ماشین وابسته هستند، اطمینان از پیش‌بینی‌های قابل اعتماد، قابل توضیح و خوش‌کالیبره‌شده مهم‌تر از همیشه است. با به کارگیری تکنیک‌های مورد بحث در این گفتگو با برایان لوسنا، متخصصان می‌توانند مدل‌های یادگیری ماشینی بسازند که نه تنها دقیق، بلکه واقعاً قابل اعتماد باشند.