مدلسازی پیشبینیکننده (Predictive modeling) در قلب برنامههای کاربردی مدرن یادگیری ماشین قرار دارد. از تشخیص تقلب گرفته تا پیشبینی مالی، توانایی ارائه پیشبینیهای دقیق و قابل اعتماد میتواند موفقیت یک کسبوکار دادهمحور را تعیین کند. اما چگونه متخصصان یادگیری ماشین میتوانند قابلیت اطمینان مدلهای خود را بهبود بخشند، به ویژه هنگام کار با دادههای جدولی؟ در یکی از قسمتهای اخیر پادکست Ai X از ODSC، برایان لوسنا (Brian Lucena)، دانشمند داده برجسته و مربی، و مدیر Numeristical، بینشهای خود را در مورد تقویت گرادیان (gradient boosting)، تخمین عدم قطعیت (uncertainty estimation) و کالیبراسیون مدل (model calibration) به اشتراک گذاشت - موضوعاتی که برای ساخت سیستمهای یادگیری ماشین قوی بسیار مهم هستند.
شما میتوانید پادکست کامل را در Spotify، Apple و SoundCloud گوش دهید.
برایان لوسنا بحث را با توصیههایی برای متخصصان یادگیری ماشین که در حال پیمایش در چشمانداز هوش مصنوعی به سرعت در حال تحول هستند، به پایان رساند. در حالی که هوش مصنوعی مولد (generative AI) و مدلهای زبانی بزرگ (LLMs) توجهها را به خود جلب میکنند، بسیاری از برنامههای کاربردی یادگیری ماشین حیاتی کسبوکار هنوز به تکنیکهای مدلسازی پیشبینیکننده سنتی متکی هستند.
برای دانشمندان و مهندسان داده، نکات کلیدی عبارتند از:
تقویت گرادیان همچنان یک نیروگاه برای دادههای ساختاریافته است و نباید به نفع یادگیری عمیق نادیده گرفته شود.
تخمین عدم قطعیت بینشهای عمیقتری را در مورد پیشبینیهای مدل ارائه میدهد و امکان تصمیمگیری آگاهانهتر را فراهم میکند.
کالیبراسیون برای معنادار کردن امتیازهای احتمال بسیار مهم است و باید یک گام استاندارد در استقرار مدل باشد.
نظارت بر رانش مدل قابلیت اطمینان بلندمدت را تضمین میکند و مدلها را با شرایط متغیر دنیای واقعی هماهنگ نگه میدارد.
از آنجایی که کسبوکارها به طور فزایندهای به یادگیری ماشین وابسته هستند، اطمینان از پیشبینیهای قابل اعتماد، قابل توضیح و خوشکالیبرهشده مهمتر از همیشه است. با به کارگیری تکنیکهای مورد بحث در این گفتگو با برایان لوسنا، متخصصان میتوانند مدلهای یادگیری ماشینی بسازند که نه تنها دقیق، بلکه واقعاً قابل اعتماد باشند.