اگر نشنیدهاید، Anthropic مدل هوش مصنوعی خود، Claude 3.7 Sonnet را به صورت زنده پخش میکند که تلاش میکند یک بازی پوکمون قرمز را به پایان برساند.
این آزمایش، با عنوان "Claude Plays Pokémon"، قرار است نمایشی از "عوامل هوش مصنوعی" باشد، رقابت مداوم صنعت برای ایجاد مدلهای هوش مصنوعی که قادر به عملکرد مستقل با تعامل با محیط خود هستند.
کلود موفق شده است به طرز شگفت انگیزی در بازی پیشرفت کند، سه نشان باشگاه را به دست آورد و تا این هفته به شهر Cerulean رسیده است. اما با سرعتی دردناک و آهسته پیش میرود و پس از هر حرکت "فکر" میکند، گاهی اوقات برای فواصل طولانیتر از سایرین. برای مثال، کلود تقریباً 80 ساعت عذابآور، سرگردان و بیهدف در اطراف کوه مون سرگردان بود، قبل از اینکه سرانجام نردبانی را پیدا کند که برای فرار از آن نیاز داشت. بینندگان سرمایهگذاری شده Twitch آهی از سر آسودگی کشیدند.
به نظر نمیرسد که پیشرفت سرعت بگیرد. گردش هوش مصنوعی Anthropic در منطقه Kanto بیشتر به دویدن در اطراف در دایرهها تبدیل شده است و از حرکت بعدی خود مطمئن نیست. او باید از مسیر 5 بپرد تا به مرحله بعدی برسد، اما کجا و چگونه؟
یک پنجره متنی در پخش زنده فرآیند فکری کلود نشان میدهد که هوش مصنوعی از یک فرآیند حذف برای رد کردن مکانهایی استفاده میکند که ورودی مسیر 5 نیستند. اما آیا او این را به هم متصل میکند که برای دسترسی به مسیر افسانهای، باید از HM "Cut" روی چند درخت تخریبپذیر استفاده کند؟ به نظر نمیرسد: او مدام تکرار میکند که چگونه باید "دروازه" مسیر را پیدا کند.
به طور خلاصه، کلود گیر کرده است. یکی از مدلهای پیشرو در صنعت هوش مصنوعی ممکن است با بازیای که توسط کودکان واقعی برای نسلها شکست خورده است، گیج شود.
به گفته مهندسان، یک چالش بزرگ برای کلود، پردازش بصری چیزی است که در بازی میبیند. کلود در تفسیر بخشهای مبتنی بر متن بازی، از جمله نبردهای پوکمون، عالی است. او همچنین به RAM بازی دسترسی دارد تا اطلاعاتی مانند مختصات درون بازی خود را جمع آوری کند. اما او نمیتواند به طور مداوم تعداد کمی از پیکسلهایی را که محیط کمرزولوشن او را تشکیل میدهند، تفسیر کند.
دیوید هرشی، مهندس Anthropic که در پشت آزمایش پوکمون قرار دارد، در مصاحبهای با Ars Technica گفت: "کلود هنوز در درک آنچه در صفحه نمایش است، چندان خوب نیست." "شما میبینید که او سعی میکند تمام وقت به دیوارها برخورد کند." هرشی به طرز عجیبی پیشنهاد میکند، اگر کلود یک بازی واقعگرایانهتر از نظر بصری انجام میداد، ممکن است بهتر عمل کند.
هرشی افزود: "برای من بسیار آسان است که بفهمم [یک] ساختمان [در بازی] یک ساختمان است و نمیتوانم از یک ساختمان عبور کنم." "و این [چیزی] است که برای کلود درک آن بسیار چالش برانگیز است."
با این حال، مواقعی وجود دارد که کلود به طرز شگفت انگیزی باهوش است، مانند پاسخ دادن به سرنخهای درون بازی که برای گمراه کننده طراحی شدهاند.
هرشی با توصیف یکی از اولین ماموریتهای بازی، به Ars گفت: "بسیار خندهدار است که به شما میگویند باید به دنبال پروفسور اوک در همسایگی بروید و سپس او آنجا نیست." "به عنوان یک کودک 5 ساله، این برای من بسیار گیج کننده بود. اما کلود معمولاً همان مجموعه حرکاتی را طی میکند که با مادر صحبت میکند، به آزمایشگاه میرود، [اوک] را پیدا نمیکند، میگوید، 'من باید چیزی را بفهمم.'"
هرشی افزود: "به اندازه کافی پیچیده است که به نوعی حرکات روشی را که [انسانها] واقعاً باید آن را یاد بگیرند، طی کند."
بنابراین شاید هنوز همه چیز از دست نرفته باشد. هنوز زمان زیادی برای Claude 3.7 Sonnet وجود دارد تا اوضاع را تغییر دهد. او به طور قابل توجهی جلوتر از سلف خود 3.0 Sonnet رفته است، که حتی نتوانست از شهر Pallet، منطقه شروع بازی، خارج شود. با این حال، مبارزات او نشان میدهد که این فناوری هنوز راه درازی در پیش دارد تا "عاملیت" داشته باشد، چه رسد به اینکه به وعده خود مبنی بر فراتر رفتن از تواناییهای انسان برسد.