تصویر از تیم رونی از طریق گتی / نینتندو / گیم فریک / فیوچریسم
تصویر از تیم رونی از طریق گتی / نینتندو / گیم فریک / فیوچریسم

یکی از پیشرفته‌ترین عوامل هوش مصنوعی جهان در تلاش برای شکست دادن یک بازی پوکمون کودکان کاملاً گیر کرده است

خیلی مؤثر نیست...

اگر نشنیده‌اید، Anthropic مدل هوش مصنوعی خود، Claude 3.7 Sonnet را به صورت زنده پخش می‌کند که تلاش می‌کند یک بازی پوکمون قرمز را به پایان برساند.

این آزمایش، با عنوان "Claude Plays Pokémon"، قرار است نمایشی از "عوامل هوش مصنوعی" باشد، رقابت مداوم صنعت برای ایجاد مدل‌های هوش مصنوعی که قادر به عملکرد مستقل با تعامل با محیط خود هستند.

کلود موفق شده است به طرز شگفت انگیزی در بازی پیشرفت کند، سه نشان باشگاه را به دست آورد و تا این هفته به شهر Cerulean رسیده است. اما با سرعتی دردناک و آهسته پیش می‌رود و پس از هر حرکت "فکر" می‌کند، گاهی اوقات برای فواصل طولانی‌تر از سایرین. برای مثال، کلود تقریباً 80 ساعت عذاب‌آور، سرگردان و بی‌هدف در اطراف کوه مون سرگردان بود، قبل از اینکه سرانجام نردبانی را پیدا کند که برای فرار از آن نیاز داشت. بینندگان سرمایه‌گذاری شده Twitch آهی از سر آسودگی کشیدند.

به نظر نمی‌رسد که پیشرفت سرعت بگیرد. گردش هوش مصنوعی Anthropic در منطقه Kanto بیشتر به دویدن در اطراف در دایره‌ها تبدیل شده است و از حرکت بعدی خود مطمئن نیست. او باید از مسیر 5 بپرد تا به مرحله بعدی برسد، اما کجا و چگونه؟

یک پنجره متنی در پخش زنده فرآیند فکری کلود نشان می‌دهد که هوش مصنوعی از یک فرآیند حذف برای رد کردن مکان‌هایی استفاده می‌کند که ورودی مسیر 5 نیستند. اما آیا او این را به هم متصل می‌کند که برای دسترسی به مسیر افسانه‌ای، باید از HM "Cut" روی چند درخت تخریب‌پذیر استفاده کند؟ به نظر نمی‌رسد: او مدام تکرار می‌کند که چگونه باید "دروازه" مسیر را پیدا کند.

به طور خلاصه، کلود گیر کرده است. یکی از مدل‌های پیشرو در صنعت هوش مصنوعی ممکن است با بازی‌ای که توسط کودکان واقعی برای نسل‌ها شکست خورده است، گیج شود.

به گفته مهندسان، یک چالش بزرگ برای کلود، پردازش بصری چیزی است که در بازی می‌بیند. کلود در تفسیر بخش‌های مبتنی بر متن بازی، از جمله نبردهای پوکمون، عالی است. او همچنین به RAM بازی دسترسی دارد تا اطلاعاتی مانند مختصات درون بازی خود را جمع آوری کند. اما او نمی‌تواند به طور مداوم تعداد کمی از پیکسل‌هایی را که محیط کم‌رزولوشن او را تشکیل می‌دهند، تفسیر کند.

دیوید هرشی، مهندس Anthropic که در پشت آزمایش پوکمون قرار دارد، در مصاحبه‌ای با Ars Technica گفت: "کلود هنوز در درک آنچه در صفحه نمایش است، چندان خوب نیست." "شما می‌بینید که او سعی می‌کند تمام وقت به دیوارها برخورد کند." هرشی به طرز عجیبی پیشنهاد می‌کند، اگر کلود یک بازی واقع‌گرایانه‌تر از نظر بصری انجام می‌داد، ممکن است بهتر عمل کند.

هرشی افزود: "برای من بسیار آسان است که بفهمم [یک] ساختمان [در بازی] یک ساختمان است و نمی‌توانم از یک ساختمان عبور کنم." "و این [چیزی] است که برای کلود درک آن بسیار چالش برانگیز است."

با این حال، مواقعی وجود دارد که کلود به طرز شگفت انگیزی باهوش است، مانند پاسخ دادن به سرنخ‌های درون بازی که برای گمراه کننده طراحی شده‌اند.

هرشی با توصیف یکی از اولین ماموریت‌های بازی، به Ars گفت: "بسیار خنده‌دار است که به شما می‌گویند باید به دنبال پروفسور اوک در همسایگی بروید و سپس او آنجا نیست." "به عنوان یک کودک 5 ساله، این برای من بسیار گیج کننده بود. اما کلود معمولاً همان مجموعه حرکاتی را طی می‌کند که با مادر صحبت می‌کند، به آزمایشگاه می‌رود، [اوک] را پیدا نمی‌کند، می‌گوید، 'من باید چیزی را بفهمم.'"

هرشی افزود: "به اندازه کافی پیچیده است که به نوعی حرکات روشی را که [انسان‌ها] واقعاً باید آن را یاد بگیرند، طی کند."

بنابراین شاید هنوز همه چیز از دست نرفته باشد. هنوز زمان زیادی برای Claude 3.7 Sonnet وجود دارد تا اوضاع را تغییر دهد. او به طور قابل توجهی جلوتر از سلف خود 3.0 Sonnet رفته است، که حتی نتوانست از شهر Pallet، منطقه شروع بازی، خارج شود. با این حال، مبارزات او نشان می‌دهد که این فناوری هنوز راه درازی در پیش دارد تا "عاملیت" داشته باشد، چه رسد به اینکه به وعده خود مبنی بر فراتر رفتن از توانایی‌های انسان برسد.