یک همکاری پژوهشی بین دانشگاه شانگهای جیائو تونگ، موسسه شانگهای چی ژی و هوآوی تکنولوژیز، BAFT را معرفی کرده است؛ یک سیستم ذخیره خودکار پیشرفته برای آموزش هوش مصنوعی که زمان از کار افتادگی را به حداقل رسانده و کارایی را بهینه میکند.
BAFT که برای بهرهگیری از لحظات بیکاری در جریانهای کاری آموزش طراحی شده است، به طور قابل توجهی تحمل خطا را افزایش میدهد و در عین حال سربار محاسباتی را کاهش میدهد و معیار جدیدی در صنعت برای توسعه قابل اعتماد مدلهای هوش مصنوعی تعیین میکند. این پژوهش در مجله Frontiers of Computer Science منتشر شده است.
BAFT مانند ویژگی ذخیره خودکار در بازیهای ویدیویی عمل میکند و تضمین میکند که پیشرفت آموزش هوش مصنوعی در طول دورههای کوتاه بیکاری یا «حبابها» حفظ شود. برخلاف روشهای سنتی چکپوینتینگ (ایست بازرسی) که باعث کندی قابل توجه سیستم میشوند، BAFT به طور یکپارچه با کمتر از ۱٪ سربار اضافی در فرآیند آموزش ادغام میشود و از پیشرفت حیاتی با حداقل وقفه محافظت میکند.
BAFT با کاهش هدررفت محاسباتی و افزایش تحمل خطا، هوشمندی و کارایی را به آموزش مدل هوش مصنوعی میآورد. یک سیستم آموزش هوشمندتر تضمین میکند که مدلهای هوش مصنوعی به طور مداوم در حال یادگیری و تطبیق هستند بدون توقفها یا اختلالات غیرضروری. با بهرهگیری از لحظات بیکاری، BAFT تخصیص منابع را بهینه میکند و به مدلهای هوش مصنوعی اجازه میدهد تا ضمن حفظ دقت و پایداری، از قدرت پردازش موجود نهایت استفاده را ببرند.
یک فرآیند آموزش قابل اعتماد به این معنی است که مدلهای هوش مصنوعی میتوانند به سرعت از خرابیها بازیابی شوند، زمان آموزش از دست رفته را کاهش داده و عملکرد کلی را بهبود بخشند. سیستمهای آموزش هوش مصنوعی سنتی با خطر از دست دادن پیشرفت قابل توجه به دلیل خاموشیهای غیرمنتظره یا خطاهای سیستم مواجه هستند.
BAFT این خطر را با امکان بازیابی تقریباً فوری کاهش میدهد، از ساعتها کار از دست رفته جلوگیری میکند و آموزش هوش مصنوعی را قابل پیشبینیتر و قابل اتکاتر میسازد. مطالعات نشان میدهد که BAFT میتواند تلفات آموزش را تا ۹۸٪ کاهش دهد، که آن را به یکی از کارآمدترین سیستمهای بازیابی هوش مصنوعی موجود امروزی تبدیل میکند.
پروفسور مینیی گوو، پژوهشگر اصلی در دانشگاه شانگهای جیائو تونگ، گفت: «این چارچوب گام مهمی رو به جلو در آموزش توزیعشده هوش مصنوعی است. این یک راه حل عملی است که تضمین میکند مدلهای هوش مصنوعی در مقیاس بزرگ حتی در مواجهه با خرابیهای غیرمنتظره سیستم، مقاوم باقی میمانند.»
مزایای کلیدی BAFT:
- حداقل زمان از کار افتادگی: تلفات بالقوه آموزش هوش مصنوعی را به تنها ۱ تا ۳ تکرار (۰.۶ تا ۵.۵ ثانیه) کاهش میدهد و بازیابی یکپارچه را تضمین میکند.
- عملکرد بهینه: انتقالهای لحظهای (snapshot) را در لحظات بیکاری پیادهسازی میکند، برخلاف سیستمهای چکپوینتینگ سنتی که عملیات را تا ۵۰٪ کند میکنند.
- مقیاسپذیر در صنایع مختلف: مقاومت مدل هوش مصنوعی را در کاربردهایی مانند فناوری خودران، دستیاران هوشمند و شبکههای یادگیری عمیق در مقیاس بزرگ افزایش میدهد.
با توجه به نقش حیاتی فزاینده هوش مصنوعی در صنایع جهانی، توانایی بازیابی سریع از خرابیهای سیستم بسیار مهم است. BAFT نه تنها وقفههای آموزشی را کاهش میدهد، بلکه تضمین میکند که سازمانها میتوانند عملیات هوش مصنوعی را بدون زمان از کار افتادگی پرهزینه، به طور کارآمد مقیاسبندی کنند.