نماینده هوش مصنوعی مانوس آخرین پیشرفت هوش مصنوعی چین است که توجهات را در سیلیکون ولی و فراتر از آن به خود جلب کرده است. مانوس هفته گذشته از طریق یک پیش نمایش با دعوت اختصاصی راه اندازی شد و نشان دهنده بلندپروازانه ترین ورود چین به بازار نوظهور نمایندگان هوش مصنوعی است.
بر خلاف هر چیزی که تا به امروز دیده شده است، نماینده هوش مصنوعی مانوس فقط با کاربران چت نمی کند - ادعا می شود که قادر است به طور مستقل وظایف پیچیده چند مرحله ای را با حداقل راهنمایی انسانی انجام دهد.
نماینده هوش مصنوعی مانوس که توسط استارتاپ چینی Butterfly Effect با پشتیبانی مالی غول فناوری Tencent Holdings توسعه یافته است، به دلیل توانایی خود در پر کردن شکاف بین قابلیت های نظری هوش مصنوعی و کاربردهای عملی و واقعی، توجه جهانی را به خود جلب کرده است. این سیستم از یک معماری چند مدلی نوآورانه استفاده می کند که نقاط قوت چندین مدل زبان پیشرو را با هم ترکیب می کند.
اجرای وظایف مستقل پیشرفته
پیک جی ییچائو، بنیانگذار و دانشمند ارشد Butterfly Effect، در پستی در X گفت که هوش مصنوعی نمایندگی با استفاده از مدلهای زبانی بزرگ موجود، از جمله Claude از Anthropic و نسخههای دقیق تنظیمشده Qwen متنباز Alibaba، ساخته شده است.
ماهیت چند مدلی آن به مانوس اجازه می دهد تا از نقاط قوت مختلف هوش مصنوعی مطابق با نیازهای آن استفاده کند، که منجر به استدلال و قابلیت های اجرایی پیچیده تر می شود.
CNN Business اظهار داشت: "نماینده هوش مصنوعی مانوس نشان دهنده یک رویکرد اساساً متفاوت به هوش مصنوعی است." بر اساس پوشش خبری، مانوس "می تواند وظایف پیچیده و چند مرحله ای مانند بررسی رزومه ها و ایجاد یک وب سایت را انجام دهد" و "نه تنها ایده تولید می کند، بلکه نتایج ملموسی مانند تهیه گزارشی را ارائه می دهد که خواص را برای خرید بر اساس معیارهای خاص توصیه می کند."
ارزیابی عملکرد در دنیای واقعی
در یک ارزیابی عملی گسترده، MIT Technology Review نماینده هوش مصنوعی مانوس را در سه دسته وظیفه متمایز آزمایش کرد: تدوین فهرست های جامع روزنامه نگاران، انجام جستجوهای املاک و مستغلات با پارامترهای پیچیده، و شناسایی نامزدها برای برنامه معتبر Innovators Under 35 خود.
Caiwei Chen در این ارزیابی نوشت: "استفاده از مانوس مانند همکاری با یک کارآموز بسیار باهوش و کارآمد است." "در حالی که گاهی اوقات درک درستی از آنچه از آن خواسته می شود ندارد، فرضیات نادرستی می کند یا برای تسریع وظایف، میان بر می زند، استدلال خود را به وضوح توضیح می دهد، به طرز قابل توجهی سازگار است و می تواند با ارائه دستورالعمل ها یا بازخورد دقیق، به طور اساسی بهبود یابد."
این ارزیابی یکی از بارزترین ویژگی های نماینده هوش مصنوعی مانوس را نشان داد - رابط "رایانه مانوس"، که شفافیت بی سابقه ای را در روند تصمیم گیری هوش مصنوعی فراهم می کند.
پنجره برنامه به کاربران اجازه می دهد تا اقدامات نماینده را در زمان واقعی مشاهده کرده و در صورت لزوم مداخله کنند، و یک گردش کار مشترک انسان و هوش مصنوعی ایجاد می کند که کنترل کاربر را حفظ می کند در حالی که فرآیندهای پیچیده را خودکار می کند.
چالش های پیاده سازی فنی
علیرغم قابلیت های چشمگیر، نماینده هوش مصنوعی مانوس در پیاده سازی فعلی خود با موانع فنی قابل توجهی روبرو است. MIT Technology Review خرابی های مکرر سیستم و خطاهای timeout را در طول استفاده طولانی مدت ثبت کرد.
این پلتفرم پیام های خطا را نمایش می داد و به "بار سرویس بالا" اشاره می کرد، که نشان می دهد زیرساخت محاسباتی همچنان یک محدودیت است.
محدودیت های فنی به دسترسی بسیار محدود کمک کرده است، به طوری که کمتر از 1٪ از کاربران در لیست انتظار کدهای دعوت را دریافت می کنند - کانال رسمی Manus Discord در حال حاضر بیش از 186000 عضو جمع آوری کرده است.
بر اساس گزارش نشریه فناوری چینی 36Kr، هزینه های عملیاتی نماینده هوش مصنوعی مانوس نسبتاً رقابتی و تقریباً 2 دلار برای هر کار باقی مانده است.
مشارکت استراتژیک با Alibaba Cloud
سازندگان نماینده هوش مصنوعی مانوس از مشارکت با بخش محاسبات ابری Alibaba خبر داده اند. بر اساس گزارش South China Morning Post مورخ 11 مارس، "مانوس برای برآوردن نیازهای کاربران چینی با تیم Qwen Alibaba همکاری استراتژیک خواهد داشت."
هدف این مشارکت این است که مانوس را در "مدل ها و پلتفرم های محاسباتی داخلی" در دسترس قرار دهد، اگرچه جدول زمانی پیاده سازی نامشخص است.
پیشرفت های موازی در مدل های پایه
مشارکت Manus-Alibaba همزمان با پیشرفت های Alibaba در فناوری مدل پایه هوش مصنوعی است. در 6 مارس، این شرکت مدل استدلال QwQ-32B خود را منتشر کرد و ادعا کرد که ویژگی های عملکردی دارد که از o1-mini OpenAI فراتر می رود و با مدل R1 DeepSeek، با وجود تعداد پارامترهای کمتر، رقابت می کند.
CNN Business گزارش داد: "Alibaba در بیانیه ای آنلاین از مدل جدید خود، QwQ-32B، به عنوان ارائه دهنده عملکرد استثنایی، تقریباً به طور کامل فراتر از OpenAI-o1-mini و رقابت با قوی ترین مدل استدلال متن باز، DeepSeek-R1، یاد کرد."
به دستاوردهای ادعا شده در زمینه کارایی به ویژه قابل توجه است - Alibaba می گوید QwQ-32B با تنها 32 میلیارد پارامتر در مقایسه با 671 میلیارد پارامتر در مدل R1 DeepSeek، به عملکرد رقابتی دست می یابد. اندازه مدل کاهش یافته نشان دهنده الزامات محاسباتی بسیار کمتر برای آموزش و استنتاج با قابلیت های استدلال پیشرفته است.
سرمایه گذاری های استراتژیک چین در هوش مصنوعی
نماینده هوش مصنوعی مانوس و پیشرفتهای مدل Alibaba منعکسکننده تاکید استراتژیک گستردهتر چین بر توسعه هوش مصنوعی است. دولت چین حمایت صریحی از "صنایع نوظهور و صنایع آینده" اعلام کرده است و هوش مصنوعی در کنار محاسبات کوانتومی و رباتیک مورد توجه ویژه قرار دارد.
Alibaba در سه سال آینده 380 میلیارد یوان (تقریباً 52.4 میلیارد دلار) در زیرساخت های هوش مصنوعی و محاسبات ابری سرمایه گذاری خواهد کرد، رقمی که به گفته این شرکت، از کل سرمایه گذاری های آن در این بخش ها در دهه گذشته فراتر می رود.
همانطور که Caiwei Chen از MIT Technology Review گفت: "شرکت های هوش مصنوعی چینی فقط از ردپای همتایان غربی خود پیروی نمی کنند. آنها به جای نوآوری در مدل های پایه، به طور فعال در حال شکل دادن به پذیرش نمایندگان مستقل هوش مصنوعی به روش خود هستند."
نماینده هوش مصنوعی مانوس همچنین نمونه ای از این است که چگونه اکوسیستم هوش مصنوعی چین فراتر از صرفاً تکرار پیشرفت های غربی تکامل یافته است. سیاستهای دولتی که خوداتکایی فناورانه را ترویج میکنند، ابتکارات تامین مالی قابل توجه، و خط لوله رو به رشد استعدادهای متخصص هوش مصنوعی از دانشگاههای چین، شرایطی را برای نوآوری اصلی ایجاد کردهاند.
به جای یک رویکرد واحد به هوش مصنوعی، ما شاهد فلسفههای پیادهسازی متنوعی هستیم که احتمالاً منجر به سیستمهای مکمل بهینهسازی شده برای مصارف و زمینههای فرهنگی مختلف میشود.