مدل هوش مصنوعی Microsoft Muse
مدل هوش مصنوعی Microsoft Muse

مایکروسافت از Muse رونمایی کرد: یک مدل هوش مصنوعی مولد که توسعه بازی را متحول می‌کند

Microsoft Research از "Muse" رونمایی کرده است، یک مدل هوش مصنوعی مولد که برای پشتیبانی از توسعه بازی با تولید تصاویر بازی و اقدامات کنترلر طراحی شده است. این اطلاعیه همراه با انتشار مقاله‌ای در Nature است که جزئیات توسعه و قابلیت‌های این مدل را شرح می‌دهد.

کار Muse در بازی

Muse بخشی از چارچوب World and Human Action Model (WHAM) است و از طریق همکاری بین تیم‌های Game Intelligence و Teachable AI Experiences در Microsoft Research به همراه Ninja Theory از Xbox Game Studios ایجاد شده است.

این مدل بر روی داده‌های گیم‌پلی Bleeding Edge، یک بازی چندنفره ۲۰۲۰ که توسط Ninja Theory توسعه یافته، آموزش داده شده است.

این انتشار یک گام مهم به سوی ادغام هوش مصنوعی مولد در طراحی بازی است. Muse می‌تواند سکانس‌های گیم‌پلی را با تولید محیط‌های بصری بازی و اقدامات بازیکن بر اساس راهنمایی انسانی شبیه‌سازی کند. این به توسعه‌دهندگان اجازه می‌دهد تا ایده‌های خلاقانه جدید را کشف کرده و فرآیند نمونه‌سازی خود را ساده‌تر کنند.

برای تشویق به تحقیقات و توسعه بیشتر، Microsoft وزن‌های مدل Muse و داده‌های نمونه را به صورت متن‌باز ارائه می‌دهد و دسترسی به WHAM Demonstrator - ابزاری که یک رابط بصری برای تعامل با Muse ارائه می‌دهد - را فراهم می‌کند. این منابع از طریق Azure AI Foundry در دسترس هستند.

مشارکت‌کنندگان اصلی این پروژه بر پتانسیل تاثیرگذاری مدل تاکید می‌کنند. گاوین کاستلو، مدیر فنی Ninja Theory، گفت: «شگفت‌انگیز بود که دیدم Microsoft Research از محیط و داده‌های Bleeding Edge برای کشف تکنیک‌های جدید در یک صنعت هوش مصنوعی با سرعت در حال حرکت استفاده کرده است.»

توسعه

توسعه Muse ناشی از پیشرفت‌ها در یادگیری ماشین و نیاز به مقیاس‌بندی آموزش مدل بود. محققان در ابتدا از یک خوشه V100 GPU استفاده کردند قبل از اینکه به H100 GPUها منتقل شوند، که به مدل اجازه می‌دهد تا تصاویر با وضوح بالاتر (300×180 پیکسل) تولید کند و در تمام هفت نقشه Bleeding Edge کار کند.

ارزیابی Muse بر سه قابلیت اصلی متمرکز بود: سازگاری، تنوع و پایداری. سازگاری تضمین می‌کند که سکانس‌های گیم‌پلی از قوانین و فیزیک درون بازی پیروی می‌کنند. تنوع، توانایی مدل در تولید نتایج گیم‌پلی متنوع از یک دستور واحد را اندازه‌گیری می‌کند.

پایداری به مدل اجازه می‌دهد تا تغییرات کاربر را ادغام کند، مانند معرفی شخصیت‌های جدید به یک صحنه. رویکرد چند رشته‌ای کلید توسعه Muse بود.

محققان از نزدیک با توسعه‌دهندگان بازی همکاری کردند تا قابلیت‌های مدل را با نیازهای خلاقانه هماهنگ کنند. لیندا ون، یک محقق طراحی که در این پروژه شرکت داشت، گفت: «به همین دلیل ما از سازندگان بازی دعوت کردیم تا از ابتدا به ما در شکل‌دهی این فناوری کمک کنند.» او افزود که این تیم با درگیر کردن سازندگان از زمینه‌های کمتر نماینده، تنوع را در اولویت قرار داده است.

Muse در عمل

یک هکاتون داخلی Microsoft منجر به ایجاد WHAM Demonstrator شد که تعامل عملی با Muse را امکان‌پذیر می‌کند. این ابزار به توسعه‌دهندگان اجازه می‌دهد تا سکانس‌های گیم‌پلی را کشف کرده و ایده‌ها را به صورت مشترک آزمایش کنند.

محقق ارشد تابش رشید در مورد این فرآیند گفت: «پس از ماه‌ها آزمایش، دیدن خروجی‌های مدل روی یک نقشه متفاوت و عدم نیاز به این همه دقت در تصاویر کوچک‌تر، بسیار لذت‌بخش بود.»

با انتشار عمومی Muse، Microsoft قصد دارد توسعه‌دهندگان و محققان را برای پیشبرد مرزهای هوش مصنوعی مولد در بازی الهام بخشد. انتظار می‌رود که مدل متن‌باز، داده‌ها و WHAM Demonstrator به عنوان منابع ارزشمندی در شکل‌دهی آینده توسعه بازی با کمک هوش مصنوعی عمل کنند.