Microsoft Research از "Muse" رونمایی کرده است، یک مدل هوش مصنوعی مولد که برای پشتیبانی از توسعه بازی با تولید تصاویر بازی و اقدامات کنترلر طراحی شده است. این اطلاعیه همراه با انتشار مقالهای در Nature است که جزئیات توسعه و قابلیتهای این مدل را شرح میدهد.
کار Muse در بازی
Muse بخشی از چارچوب World and Human Action Model (WHAM) است و از طریق همکاری بین تیمهای Game Intelligence و Teachable AI Experiences در Microsoft Research به همراه Ninja Theory از Xbox Game Studios ایجاد شده است.
این مدل بر روی دادههای گیمپلی Bleeding Edge، یک بازی چندنفره ۲۰۲۰ که توسط Ninja Theory توسعه یافته، آموزش داده شده است.
این انتشار یک گام مهم به سوی ادغام هوش مصنوعی مولد در طراحی بازی است. Muse میتواند سکانسهای گیمپلی را با تولید محیطهای بصری بازی و اقدامات بازیکن بر اساس راهنمایی انسانی شبیهسازی کند. این به توسعهدهندگان اجازه میدهد تا ایدههای خلاقانه جدید را کشف کرده و فرآیند نمونهسازی خود را سادهتر کنند.
برای تشویق به تحقیقات و توسعه بیشتر، Microsoft وزنهای مدل Muse و دادههای نمونه را به صورت متنباز ارائه میدهد و دسترسی به WHAM Demonstrator - ابزاری که یک رابط بصری برای تعامل با Muse ارائه میدهد - را فراهم میکند. این منابع از طریق Azure AI Foundry در دسترس هستند.
مشارکتکنندگان اصلی این پروژه بر پتانسیل تاثیرگذاری مدل تاکید میکنند. گاوین کاستلو، مدیر فنی Ninja Theory، گفت: «شگفتانگیز بود که دیدم Microsoft Research از محیط و دادههای Bleeding Edge برای کشف تکنیکهای جدید در یک صنعت هوش مصنوعی با سرعت در حال حرکت استفاده کرده است.»
توسعه
توسعه Muse ناشی از پیشرفتها در یادگیری ماشین و نیاز به مقیاسبندی آموزش مدل بود. محققان در ابتدا از یک خوشه V100 GPU استفاده کردند قبل از اینکه به H100 GPUها منتقل شوند، که به مدل اجازه میدهد تا تصاویر با وضوح بالاتر (300×180 پیکسل) تولید کند و در تمام هفت نقشه Bleeding Edge کار کند.
ارزیابی Muse بر سه قابلیت اصلی متمرکز بود: سازگاری، تنوع و پایداری. سازگاری تضمین میکند که سکانسهای گیمپلی از قوانین و فیزیک درون بازی پیروی میکنند. تنوع، توانایی مدل در تولید نتایج گیمپلی متنوع از یک دستور واحد را اندازهگیری میکند.
پایداری به مدل اجازه میدهد تا تغییرات کاربر را ادغام کند، مانند معرفی شخصیتهای جدید به یک صحنه. رویکرد چند رشتهای کلید توسعه Muse بود.
محققان از نزدیک با توسعهدهندگان بازی همکاری کردند تا قابلیتهای مدل را با نیازهای خلاقانه هماهنگ کنند. لیندا ون، یک محقق طراحی که در این پروژه شرکت داشت، گفت: «به همین دلیل ما از سازندگان بازی دعوت کردیم تا از ابتدا به ما در شکلدهی این فناوری کمک کنند.» او افزود که این تیم با درگیر کردن سازندگان از زمینههای کمتر نماینده، تنوع را در اولویت قرار داده است.
Muse در عمل
یک هکاتون داخلی Microsoft منجر به ایجاد WHAM Demonstrator شد که تعامل عملی با Muse را امکانپذیر میکند. این ابزار به توسعهدهندگان اجازه میدهد تا سکانسهای گیمپلی را کشف کرده و ایدهها را به صورت مشترک آزمایش کنند.
محقق ارشد تابش رشید در مورد این فرآیند گفت: «پس از ماهها آزمایش، دیدن خروجیهای مدل روی یک نقشه متفاوت و عدم نیاز به این همه دقت در تصاویر کوچکتر، بسیار لذتبخش بود.»
با انتشار عمومی Muse، Microsoft قصد دارد توسعهدهندگان و محققان را برای پیشبرد مرزهای هوش مصنوعی مولد در بازی الهام بخشد. انتظار میرود که مدل متنباز، دادهها و WHAM Demonstrator به عنوان منابع ارزشمندی در شکلدهی آینده توسعه بازی با کمک هوش مصنوعی عمل کنند.