مانوس: آنچه باید بدانید

مانوس چیست و چه تفاوتی با دستیارهای هوش مصنوعی موجود دارد؟

مانوس به عنوان "اولین عامل هوش مصنوعی عمومی" از استارت‌آپ چینی مونیکا (Monica.ai) توصیف می‌شود. مانوس به جای تولید پاسخ‌های متنی ساده مانند دستیارهای هوش مصنوعی معمولی، به طور خودکار وظایف پیچیده را از ابتدا تا انتها انجام می‌دهد: در وب گشت و گذار می‌کند، با برنامه‌ها تعامل می‌کند، کد می‌نویسد و اجرا می‌کند و اطلاعات را از منابع مختلف ادغام می‌کند. یک تمایز کلیدی، گردش کار ناهمزمان آن است. از یک "رایانه مجازی" خودکفا برای رسیدگی به وظایف در پس‌زمینه استفاده می‌کند، بنابراین کاربران می‌توانند در حین تکمیل تکالیف توسط مانوس، به کار دیگری ادامه دهند.

مانوس از منظر فنی چگونه کار می‌کند؟

مانوس به عنوان یک سیستم چندعاملی عمل می‌کند که از چندین مدل تخصصی هوش مصنوعی تشکیل شده است (شامل، بر اساس برخی گزارش‌ها، کلود (Claude) از آنتروپیک (Anthropic) و مدل‌های Qwen که به خوبی تنظیم شده‌اند). هنگامی که وظیفه‌ای به آن محول می‌شود—مانند ارزیابی رزومه‌ها—آن هدف را به وظایف فرعی تقسیم می‌کند، یک لیست کارهای انجام دادنی را مشخص می‌کند و به طور خودکار هر مرحله را انجام می‌دهد. این شامل بازیابی داده‌ها از طریق APIها، نوشتن و اجرای کد پایتون (Python) و حتی استقرار برنامه‌های وب کوچک در صورت نیاز است. مانوس همچنین حافظه‌ای از تعاملات قبلی خود را حفظ می‌کند، که به آن امکان می‌دهد از مراحل گذشته بیاموزد و خروجی‌های خود را تکرار کند.

مانوس شامل چندین قابلیت فنی کلیدی است که عملکرد خودکار آن را امکان‌پذیر می‌کند:

ابزارهای کنترل مرورگر برای ناوبری وب
ابزارهای کنترل شل (Shell) برای عملیات سیستم
ابزارهای ویرایش فایل برای دستکاری اسناد
گردش کار مدیریت وظایف برای هماهنگی فرآیندهای پیچیده
سیستم‌های مدیریت حافظه برای حفظ متن
مکانیک‌های واگذاری وظایف فرعی برای توزیع کار در بین عوامل تخصصی

مانوس تاکنون چه کاربردهای عملی را به نمایش گذاشته است؟

وب‌سایت مانوس دارای گالری از موارد استفاده نمونه است. به علاوه، ویدئوی معرفی این مثال‌ها را به نمایش گذاشت:

غربالگری رزومه‌ها: تجزیه و تحلیل چند فایل، استخراج جزئیات کلیدی، رتبه‌بندی نامزدها و گردآوری نتایج در صفحات گسترده.
تحقیق در مورد املاک و مستغلات: جمع‌آوری داده‌های مربوط به املاک، فیلتر کردن بر اساس معیارهایی مانند ایمنی محله یا کیفیت مدرسه و ایجاد گزارش‌های خلاصه کامل.
تجزیه و تحلیل و تجسم داده‌ها: واکشی اطلاعات سهام یا مالی از طریق APIها، اجرای تجزیه و تحلیل همبستگی، تولید نمودارها، سپس استقرار وب‌سایت‌های تعاملی برای به اشتراک‌گذاری نتایج.

مانوس چگونه با عواملی مانند اپراتور OpenAI یا ابزارهای Anthropic مقایسه می‌شود؟

گزارش شده است که مانوس در معیار GAIA (General AI Assistants) از ChatGPT Deep Research OpenAI و سایر پیشنهادات بهتر عمل کرده است. بازخوردها نشان می‌دهند که این ابزار فرآیندهای چندمرحله‌ای—به ویژه فرآیندهایی که شامل مرور، دستکاری داده‌ها یا استقرار کد هستند—را مطمئن‌تر از بسیاری از عوامل رقیب مدیریت می‌کند. در حالی که مدل‌های زیربنایی ممکن است مشابه باشند، به نظر می‌رسد مانوس در سازماندهی آنها برای نهایی کردن وظایف به طور کامل برتر است، نه صرفاً تولید یک پاسخ واحد.

مانوس الهام‌بخش جایگزین‌های متن‌باز (open-source) بوده است و پروژه‌هایی مانند OpenManus توجه قابل توجهی را به خود جلب کرده‌اند. همچنین وارد یک اکوسیستم رو به رشد از چارچوب‌های عامل خودکار می‌شود که شامل پروژه‌های قبلی مانند AutoGPT و پیشنهادات اخیرتر مانند Claude Code از Anthropic می‌شود. در حالی که سیستم‌های تجاری مانند مانوس ممکن است تجربیات صیقلی‌تری ارائه دهند، جایگزین‌های متن‌باز گزینه‌های شفاف و قابل تنظیم را برای قابلیت‌های مشابه در اختیار توسعه‌دهندگان قرار می‌دهند.

چه کسی پشت مانوس است و رویکرد آنها به توسعه هوش مصنوعی چیست؟

مانوس توسط Monica.ai توسعه یافته است که توسط شیائو هونگ و جی ییچائو تأسیس شده است. شیائو هونگ یک کارآفرین زنجیره‌ای است که قبلاً ابزارهای مربوط به WeChat را ساخته و Nightingale Technology را تأسیس کرده است. جی ییچائو، دانشمند ارشد، در سن ۱۷ سالگی دبیرستان را ترک کرد تا مرورگر ماموت (Mammoth) را توسعه دهد. این شرکت در سال ۲۰۲۲ به عنوان یک افزونه مرورگر مبتنی بر هوش مصنوعی شروع به کار کرد و در سال ۲۰۲۳ بودجه سری A را با رهبری تنسنت (Tencent) و سکویا کپیتال چین (Sequoia Capital China) تأمین کرد. Monica.ai که در ووهان (Wuhan) مستقر است، پیشنهاد خرید ۳۰ میلیون دلاری از بایت‌دنس (ByteDance) را در اوایل سال ۲۰۲۴ رد کرد.

نام "مانوس" ریشه لغوی معناداری دارد و از کلمه لاتین "دست" گرفته شده است—که برای ابزاری که برای کمک به کاربران در انجام وظایف پیچیده طراحی شده است، مناسب است. لوگوی شرکت نیز دستی را نشان می‌دهد که این ارتباط را تقویت می‌کند. جالب اینجاست که "مانوس" در مراتی (زبان هندی) به معنای "انسان" نیز است که بعد فرهنگی متفاوتی به این نام می‌بخشد.

چه نوآوری‌های فنی مانوس را ممکن می‌سازد؟

یک سوال کلیدی در مورد مانوس این است که آیا نوآوری اصلی آن در فناوری جدید نهفته است یا در ادغام مؤثر قابلیت‌های هوش مصنوعی موجود. مانوس نشان‌دهنده یک پیشرفت در تحقیقات بنیادی هوش مصنوعی نیست، بلکه اجرای و ادغام عالی محصول است. به نظر می‌رسد از ترکیبی از مدل‌های موجود (احتمالاً شامل Claude از Anthropic) در یک معماری چندعاملی استفاده می‌کند. نوآوری در طراحی سیستم نهفته است که به این مدل‌ها اجازه می‌دهد به طور مؤثر با هم کار کنند و مانند یک انسان با وب و برنامه‌ها تعامل داشته باشند. این شرکت قصد دارد برخی از مدل‌های خود را در اواخر سال جاری به صورت متن‌باز منتشر کند، به ویژه چیزی به نام "poolstring for Manus".

مانوس نشان می‌دهد که شرکت‌های چینی می‌توانند از طریق اجرای محصول و نه تحقیقات بنیادی، به طور مؤثر در بازارهای جهانی هوش مصنوعی رقابت کنند.

پیامدهای آن برای توسعه‌دهندگان برنامه‌های هوش مصنوعی چیست؟

برای توسعه‌دهندگانی که برنامه‌های هوش مصنوعی می‌سازند، مانوس ارزش تغییر تمرکز از توسعه مدل به مهندسی و ادغام محصول را نشان می‌دهد. این نشان می‌دهد که مزایای رقابتی می‌تواند از نحوه استفاده و ترکیب مدل‌ها به دست آید تا ایجاد مدل‌های جدید. این پیشنهاد فرصت‌هایی را در:

ساخت معماری‌های عاملی که می‌توانند وظایف دنیای واقعی را به طور خودکار انجام دهند
ایجاد عوامل خاص دامنه که در عمودی‌های خاص برتری دارند
توسعه ابزارهایی که به مدیریت و نظارت بر عوامل خودکار کمک می‌کنند
ساخت رابط‌هایی که قابلیت‌های عامل را برای کاربران غیرفنی در دسترس قرار می‌دهند
ایجاد سیستم‌هایی که می‌توانند چندین عامل تخصصی را به هم متصل کنند

مانوس چه چیزی در مورد آینده عوامل هوش مصنوعی به ما می‌گوید؟

مانوس نشان می‌دهد که عوامل هوش مصنوعی سریع‌تر از آنچه بسیاری پیش‌بینی می‌کردند، از مفهوم به واقعیت عملی تبدیل می‌شوند. قابلیت‌های فنی برای ایجاد عوامل خودکار مفید از قبل وجود دارد، اگرچه چارچوب‌های نظارتی و مدل‌های مسئولیت هنوز در حال توسعه هستند.

برای توسعه‌دهندگان، موفقیت مانوس نشان می‌دهد که بازار عوامل هوش مصنوعی عملی در حال حاضر در حال ظهور است، نه سال‌ها در آینده. همچنین نشان می‌دهد که رقابت در این فضا جهانی خواهد بود و نوآوری از آزمایشگاه‌های هوش مصنوعی تأسیس شده و استارت‌آپ‌های چابک سرچشمه می‌گیرد.

اهمیت پیشتازی یک شرکت چینی در توسعه عامل هوش مصنوعی چیست؟

مانوس نشان می‌دهد که نوآوری در برنامه‌های هوش مصنوعی لزوماً از کسانی که پیشرفته‌ترین مدل‌ها یا منابع محاسباتی را دارند، ناشی نمی‌شود. این نشان می‌دهد که شرکت‌های چینی می‌توانند از طریق اجرای محصول و نه تحقیقات بنیادی، به طور مؤثر در بازارهای جهانی هوش مصنوعی رقابت کنند.

برای توسعه‌دهندگان غربی، این نشان‌دهنده افزایش رقابت جهانی در برنامه‌های هوش مصنوعی و اهمیت سرعت اجرا است. همچنین نشان می‌دهد که محیط‌های نظارتی مختلف ممکن است انواع مختلفی از نوآوری را مجاز کنند و چالش‌ها و فرصت‌هایی را برای استقرار بین‌المللی هوش مصنوعی ایجاد کنند.

مانوس در بازارهای غربی با چه چالش‌هایی روبرو خواهد شد؟

علیرغم قابلیت‌های فنی، مانوس ممکن است با چالش‌های قابل توجهی از جمله:

بررسی نظارتی، به ویژه در مورد حریم خصوصی و امنیت داده‌ها
مشکلات مربوط به اعتماد به منشاء چینی آن در یک محیط ژئوپلیتیکی پرتنش
نگرانی‌های مربوط به مسئولیت به دلیل ماهیت خودکار آن
رقابت از سوی بازیگران تثبیت‌شده‌ای مانند OpenAI و Anthropic که احتمالاً پیشنهادات عامل خود را بهبود می‌بخشند

توسعه‌دهندگان برنامه باید این چالش‌ها را هنگام در نظر گرفتن موقعیت رقابتی و استراتژی بین‌المللی خود در نظر بگیرند.

عوامل هوش مصنوعی مانند مانوس چگونه ممکن است بر بازار کار تأثیر بگذارند؟

در حالی که در مورد تأثیر فوری بحث وجود دارد، عوامل هوش مصنوعی مانند مانوس می‌توانند بخش‌های قابل توجهی از کار اداری را خودکار کنند. با این حال، این تحول به دلیل موانع فنی، نظارتی و اجتماعی، فوری نخواهد بود.

برای کسب‌وکارهایی که برنامه‌های هوش مصنوعی را توسعه می‌دهند، این نشان‌دهنده فرصت‌هایی در:

ایجاد ابزارهایی که به جای جایگزینی کارگران انسانی، آنها را تقویت می‌کنند
ساخت سیستم‌هایی که وظایف معمول را انجام می‌دهند و در عین حال انسان‌ها را به نقش‌های استراتژیک‌تر ارتقا می‌دهند
توسعه ابزارهای آموزشی و انتقال برای نیروی کار که با هوش مصنوعی سازگار می‌شوند
ایجاد مدل‌های تجاری جدید که از قابلیت‌های انسانی و هوش مصنوعی به طور همزمان استفاده می‌کنند

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: gradient flow