آمازون هنوز در رقابت برای توسعه هوش مصنوعی (AI) پیشرفته کمی عقبتر به نظر میرسد، اما بیسر و صدا آزمایشگاهی ایجاد کرده که اکنون در عملکرد هوش مصنوعی رکوردهایی را ثبت میکند. آزمایشگاه AGI SF آمازون، که در سانفرانسیسکو واقع شده و به ساخت هوش مصنوعی عمومی (AGI)، یا هوش مصنوعی که از قابلیتهای انسان فراتر میرود، اختصاص دارد، امروز اولین ثمره کار خود را آشکار کرد: یک مدل هوش مصنوعی جدید که قادر است برخی از پیشرفتهترین عاملهای هوش مصنوعی موجود را قدرت بخشد.
آمازون میگوید مدل جدید که Amazon Nova Act نام دارد، در چندین معیار طراحیشده برای سنجش هوش و استعداد عاملهای هوش مصنوعی، از مدلهای OpenAI و Anthropic عملکرد بهتری دارد. در معیارهای GroundUI Web و ScreenSpot، Amazon Nova Act بهتر از Claude 3.7 Sonnet و OpenAI Computer Use Agent عمل میکند. بخش عمدهای از برنامه آمازون برای رقابت در بازار هوش مصنوعی، تمرکز بر ساخت عاملها است و تواناییهای مدل جدید، تلاشهای این شرکت را برای ساخت نسلی از ابزارها که بتوانند با بهترینهای موجود رقابت کنند، منعکس میکند.
دیوید لوآن، که رهبری آزمایشگاه AGI SF آمازون را بر عهده دارد، میگوید: «من معتقدم که واحد اتمی اصلی محاسبات در آینده، فراخوانی یک عامل [هوش مصنوعی] غولپیکر خواهد بود.» او پیش از این معاون مهندسی در OpenAI بود و بعداً Adept را تأسیس کرد، استارتاپی که در زمینه عاملهای هوش مصنوعی پیشگام بود، پیش از آنکه در سال ۲۰۲۴، زمانی که غول تجارت الکترونیک در این شرکت سهامدار شد، به آمازون بپیوندد.
اکثر آزمایشگاههای پیشرو هوش مصنوعی اکنون بر ساخت عاملهای هوش مصنوعی با قابلیتهای روزافزون تمرکز کردهاند. واداشتن هوش مصنوعی به تسلط بر اقدامات مستقل، و همچنین مکالمه، نویدبخش مفیدتر و ارزشمندتر کردن این فناوری است. با این حال، گذار از گفتگو به عمل هنوز تا حد زیادی در حال انجام است.
در شش ماه گذشته، OpenAI، Anthropic، Google و دیگران عاملهای مرورگر وب را به نمایش گذاشتهاند که در پاسخ به یک درخواست، اقداماتی را انجام میدهند. اما عمدتاً این عاملها هنوز غیرقابل اعتماد هستند و به راحتی میتوانند با درخواستهای باز (open-ended) دچار مشکل شوند.
لوآن میگوید هدف آمازون ساخت عاملهای هوش مصنوعی قابل اتکا بهجای عاملهای پر زرق و برق است. او میگوید چیزی که مانع پیشرفت عاملها میشود، نیاز به «دموهای جالبتر از قابلیتهای جذابی که ۶۰ درصد مواقع کار میکنند» نیست، بلکه «مشکل Waymo» است، اشارهای به اینکه چگونه خودروهای خودران قبل از اینکه بتوانند بدون نظارت به خیابانها بیایند، نیاز به آموزش برای مقابله با موارد استثنایی غیرمعمول (edge cases) داشتند.
بسیاری از به اصطلاح عاملها با ترکیب مدلهای زبان بزرگ با چندین قانون نوشتهشده توسط انسان ساخته میشوند که برای جلوگیری از انحراف آنها طراحی شدهاند، اما همچنین رفتار آنها را شکننده میکنند. Amazon Nova Act نسخهای از قویترین مدل بومی آمازون، Amazon Nova است که آموزشهای بیشتری دریافت کرده تا به آن در تصمیمگیری در مورد اینکه چه اقداماتی را و در چه زمانی انجام دهد، کمک کند. به طور کلی، لوآن میگوید، مدلهای هوش مصنوعی در تصمیمگیری برای زمان مداخله در یک کار با مشکل مواجه هستند.
برای بهبود تواناییهای عاملی Nova، آمازون از یادگیری تقویتی (reinforcement learning) استفاده میکند، روشی که به سایر مدلهای هوش مصنوعی کمک کرده تا استدلال را بهتر شبیهسازی کنند.
آمازون همچنین در مدلهای جدید خود از رباتهای فیزیکی الهام میگیرد. تیم لوآن با گروه دیگری در آمازون مستقر در سانفرانسیسکو به رهبری پیتر ابیل، استاد دانشگاه کالیفرنیا، برکلی که روی یافتن کاربردهای هوش مصنوعی برای رباتیک کار میکند، همکاری دارد. ابیل، یکی دیگر از کارمندان اولیه OpenAI، در آگوست ۲۰۲۴ پس از سرمایهگذاری آمازون در استارتاپ او، Covariant، به این شرکت پیوست. آمازون با توجه به تعداد زیاد رباتهایی که قبلاً در مراکز انجام سفارشات خود مستقر کرده است، موقعیت خوبی برای پیشرفت در رباتیک دارد.
انتشار Amazon Nova Act نشان میدهد که آمازون میتواند به عنوان یک رقیب غیرمنتظره در رقابت برای ایجاد عاملهای نرمافزاری مفید ظاهر شود. این شرکت در پاسخ به ChatGPT کند عمل کرد، اما اخیراً نشانههایی از سازماندهی مجدد خود نشان داده است. در ماه فوریه، این شرکت نسخه جدیدی از دستیار صوتی خود الکسا را با قابلیتهای مکالمه بهبود یافته و همچنین ظرفیت خودکارسازی برخی وظایف وب اعلام کرد.
یکی از موارد استفادهای که آمازون ذکر کرد، کمک الکسا در رزرو خدمات تعمیر برای اجاق گاز خراب است. لوآن میگوید قابلیتهای عاملی جدید الکسا توسط تیم او توسعه داده شده است.
همانطور که WIRED در اکتبر گذشته فاش کرد، آمازون همچنین در مورد چگونگی بهبود تجارت الکترونیک توسط عاملها از طریق خودکارسازی فرآیند یافتن و خرید کالا تحقیق کرده است. مهندسان آمازون گفتند چنین عاملی ممکن است بر اساس علایق و عادات کاربر، اقلامی را پیشاپیش به سبد خرید او اضافه کند.
علاوه بر رونمایی از مدل جدید، آمازون امروز یک کیت توسعه نرمافزار (SDK) را اعلام کرد که برای مهندسان کامپیوتر طراحی شده تا استفاده از Amazon Nova Act را برای ساخت عاملهای نرمافزاری آسانتر کند. این SDK به توسعهدهندگان اجازه میدهد تا دستورالعملهای خاصی را به عامل خود بدهند تا به آنها در پیمایش اینترنتی که برای کاربران انسانی ساخته شده است، کمک کنند. به عنوان مثال، میتوان به یک عامل دستور داد هنگام رزرو خودروی کرایهای، «پیشنهاد فروش اضافی بیمه را قبول نکن».
لوآن میگوید در نهایت، عاملهای آمازون باید به اندازهای هوشمند شوند که خودشان فریب پیشنهادهای فروش اضافی را نخورند. او میگوید: «Nova Act واقعاً اولین قدم در این چشمانداز است.»