لوگوی آمازون بر نمای یکی از مقرهای جهانی آن. عکس: ماتیاس بالک/گتی ایمجز
لوگوی آمازون بر نمای یکی از مقرهای جهانی آن. عکس: ماتیاس بالک/گتی ایمجز

آزمایشگاه هوش مصنوعی عمومی آمازون از اولین دستاورد خود رونمایی کرد: عامل‌های هوش مصنوعی پیشرفته

آزمایشگاه هوش مصنوعی آمازون، به رهبری یکی از مدیران سابق OpenAI، بر قابلیت‌های تصمیم‌گیری نسل بعدی عامل‌های نرم‌افزاری تمرکز دارد و از بینش‌های ربات‌های فیزیکی الهام می‌گیرد.

آمازون هنوز در رقابت برای توسعه هوش مصنوعی (AI) پیشرفته کمی عقب‌تر به نظر می‌رسد، اما بی‌سر و صدا آزمایشگاهی ایجاد کرده که اکنون در عملکرد هوش مصنوعی رکوردهایی را ثبت می‌کند. آزمایشگاه AGI SF آمازون، که در سانفرانسیسکو واقع شده و به ساخت هوش مصنوعی عمومی (AGI)، یا هوش مصنوعی که از قابلیت‌های انسان فراتر می‌رود، اختصاص دارد، امروز اولین ثمره کار خود را آشکار کرد: یک مدل هوش مصنوعی جدید که قادر است برخی از پیشرفته‌ترین عامل‌های هوش مصنوعی موجود را قدرت بخشد.

آمازون می‌گوید مدل جدید که Amazon Nova Act نام دارد، در چندین معیار طراحی‌شده برای سنجش هوش و استعداد عامل‌های هوش مصنوعی، از مدل‌های OpenAI و Anthropic عملکرد بهتری دارد. در معیارهای GroundUI Web و ScreenSpot، Amazon Nova Act بهتر از Claude 3.7 Sonnet و OpenAI Computer Use Agent عمل می‌کند. بخش عمده‌ای از برنامه آمازون برای رقابت در بازار هوش مصنوعی، تمرکز بر ساخت عامل‌ها است و توانایی‌های مدل جدید، تلاش‌های این شرکت را برای ساخت نسلی از ابزارها که بتوانند با بهترین‌های موجود رقابت کنند، منعکس می‌کند.

دیوید لوآن، که رهبری آزمایشگاه AGI SF آمازون را بر عهده دارد، می‌گوید: «من معتقدم که واحد اتمی اصلی محاسبات در آینده، فراخوانی یک عامل [هوش مصنوعی] غول‌پیکر خواهد بود.» او پیش از این معاون مهندسی در OpenAI بود و بعداً Adept را تأسیس کرد، استارتاپی که در زمینه عامل‌های هوش مصنوعی پیشگام بود، پیش از آنکه در سال ۲۰۲۴، زمانی که غول تجارت الکترونیک در این شرکت سهامدار شد، به آمازون بپیوندد.

اکثر آزمایشگاه‌های پیشرو هوش مصنوعی اکنون بر ساخت عامل‌های هوش مصنوعی با قابلیت‌های روزافزون تمرکز کرده‌اند. واداشتن هوش مصنوعی به تسلط بر اقدامات مستقل، و همچنین مکالمه، نویدبخش مفیدتر و ارزشمندتر کردن این فناوری است. با این حال، گذار از گفتگو به عمل هنوز تا حد زیادی در حال انجام است.

در شش ماه گذشته، OpenAI، Anthropic، Google و دیگران عامل‌های مرورگر وب را به نمایش گذاشته‌اند که در پاسخ به یک درخواست، اقداماتی را انجام می‌دهند. اما عمدتاً این عامل‌ها هنوز غیرقابل اعتماد هستند و به راحتی می‌توانند با درخواست‌های باز (open-ended) دچار مشکل شوند.

لوآن می‌گوید هدف آمازون ساخت عامل‌های هوش مصنوعی قابل اتکا به‌جای عامل‌های پر زرق و برق است. او می‌گوید چیزی که مانع پیشرفت عامل‌ها می‌شود، نیاز به «دموهای جالب‌تر از قابلیت‌های جذابی که ۶۰ درصد مواقع کار می‌کنند» نیست، بلکه «مشکل Waymo» است، اشاره‌ای به اینکه چگونه خودروهای خودران قبل از اینکه بتوانند بدون نظارت به خیابان‌ها بیایند، نیاز به آموزش برای مقابله با موارد استثنایی غیرمعمول (edge cases) داشتند.

بسیاری از به اصطلاح عامل‌ها با ترکیب مدل‌های زبان بزرگ با چندین قانون نوشته‌شده توسط انسان ساخته می‌شوند که برای جلوگیری از انحراف آن‌ها طراحی شده‌اند، اما همچنین رفتار آن‌ها را شکننده می‌کنند. Amazon Nova Act نسخه‌ای از قوی‌ترین مدل بومی آمازون، Amazon Nova است که آموزش‌های بیشتری دریافت کرده تا به آن در تصمیم‌گیری در مورد اینکه چه اقداماتی را و در چه زمانی انجام دهد، کمک کند. به طور کلی، لوآن می‌گوید، مدل‌های هوش مصنوعی در تصمیم‌گیری برای زمان مداخله در یک کار با مشکل مواجه هستند.

برای بهبود توانایی‌های عاملی Nova، آمازون از یادگیری تقویتی (reinforcement learning) استفاده می‌کند، روشی که به سایر مدل‌های هوش مصنوعی کمک کرده تا استدلال را بهتر شبیه‌سازی کنند.

آمازون همچنین در مدل‌های جدید خود از ربات‌های فیزیکی الهام می‌گیرد. تیم لوآن با گروه دیگری در آمازون مستقر در سانفرانسیسکو به رهبری پیتر ابیل، استاد دانشگاه کالیفرنیا، برکلی که روی یافتن کاربردهای هوش مصنوعی برای رباتیک کار می‌کند، همکاری دارد. ابیل، یکی دیگر از کارمندان اولیه OpenAI، در آگوست ۲۰۲۴ پس از سرمایه‌گذاری آمازون در استارتاپ او، Covariant، به این شرکت پیوست. آمازون با توجه به تعداد زیاد ربات‌هایی که قبلاً در مراکز انجام سفارشات خود مستقر کرده است، موقعیت خوبی برای پیشرفت در رباتیک دارد.

انتشار Amazon Nova Act نشان می‌دهد که آمازون می‌تواند به عنوان یک رقیب غیرمنتظره در رقابت برای ایجاد عامل‌های نرم‌افزاری مفید ظاهر شود. این شرکت در پاسخ به ChatGPT کند عمل کرد، اما اخیراً نشانه‌هایی از سازماندهی مجدد خود نشان داده است. در ماه فوریه، این شرکت نسخه جدیدی از دستیار صوتی خود الکسا را با قابلیت‌های مکالمه بهبود یافته و همچنین ظرفیت خودکارسازی برخی وظایف وب اعلام کرد.

یکی از موارد استفاده‌ای که آمازون ذکر کرد، کمک الکسا در رزرو خدمات تعمیر برای اجاق گاز خراب است. لوآن می‌گوید قابلیت‌های عاملی جدید الکسا توسط تیم او توسعه داده شده است.

همانطور که WIRED در اکتبر گذشته فاش کرد، آمازون همچنین در مورد چگونگی بهبود تجارت الکترونیک توسط عامل‌ها از طریق خودکارسازی فرآیند یافتن و خرید کالا تحقیق کرده است. مهندسان آمازون گفتند چنین عاملی ممکن است بر اساس علایق و عادات کاربر، اقلامی را پیشاپیش به سبد خرید او اضافه کند.

علاوه بر رونمایی از مدل جدید، آمازون امروز یک کیت توسعه نرم‌افزار (SDK) را اعلام کرد که برای مهندسان کامپیوتر طراحی شده تا استفاده از Amazon Nova Act را برای ساخت عامل‌های نرم‌افزاری آسان‌تر کند. این SDK به توسعه‌دهندگان اجازه می‌دهد تا دستورالعمل‌های خاصی را به عامل خود بدهند تا به آن‌ها در پیمایش اینترنتی که برای کاربران انسانی ساخته شده است، کمک کنند. به عنوان مثال، می‌توان به یک عامل دستور داد هنگام رزرو خودروی کرایه‌ای، «پیشنهاد فروش اضافی بیمه را قبول نکن».

لوآن می‌گوید در نهایت، عامل‌های آمازون باید به اندازه‌ای هوشمند شوند که خودشان فریب پیشنهادهای فروش اضافی را نخورند. او می‌گوید: «Nova Act واقعاً اولین قدم در این چشم‌انداز است.»