اولین تماس با Manus
Manus به عنوان دومین نوآوری بزرگ هوش مصنوعی چین پس از DeepSeek در سال 2025، سر و صدای زیادی به پا کرده است. در نگاه اول، شبیه یک سیستم چندعاملی معمولی به نظر میرسد، اما چیزی بیشتر از آنچه به چشم میآید، در آن وجود دارد.
تصمیم گرفتم آن را آزمایش کنم. ابتدا، از Manus خواستم حقوق و فرصتهای شغلی توسعهدهندگان جاوا، مهندسان داده، مهندسان یادگیری ماشین و دانشمندان داده را مقایسه کند. این فقط یک پاسخ کلی ارائه نداد، بلکه به طور مرتب یک لیست کارها ایجاد کرد، فهمید که از کجا اطلاعات را جمعآوری کند، تمام اطلاعات لازم را با استفاده از یک مرورگر جمعآوری کرد، اطلاعات را از صفحات وب استخراج کرد و یک گزارش ساختاریافته خوب تهیه کرد. چند مسئله جزئی وجود داشت اما کار مناسبی انجام داد.
سپس، یک سوال سخت از آن پرسیدم. از آن خواستم قیمتهای ملک را در مناطق مختلف مقایسه کند، و عمداً یک غلط املایی و یک مکان کاملاً ساختگی را در آن گنجاندم. Manus به طرز چشمگیری هر دو اشتباه را متوجه شد و از من پرسید که آیا میخواهم غلط املایی را تصحیح کنم و از حومه جعلی صرف نظر کنم یا خیر. در پایان، حتی گزارشی با چتهای چشمگیر تولید کرد. نتیجه هنوز عالی نبود، اما قطعا چشمگیر است.
یک نکته واقعاً برجسته بود: قبل از انجام هر کاری، Manus ابتدا یک سندباکس ایجاد کرد و محیط خود را تنظیم کرد. برخلاف سایر فروشندگان هوش مصنوعی که ترجیح میدهند جزئیات را پنهان کنند، Manus همه چیز را روی میز گذاشت:
چندی پیش، شخصی با افتخار اعلام کرد که Manus را جیلبریک کرده است. واکنش توسعهدهنده؟ یک شانه بالا انداختن اتفاقی - "این طوری طراحی شده است.":
در پست دیگری، Manus حتی ساختار داخلی خود را فاش کرد:
این یک طراحی غیرعادی است. بیشتر سیستمهای هوش مصنوعی عمومی، عملکرد داخلی خود را پنهان میکنند و فقط حداقل مقدار را در معرض دید کاربران قرار میدهند. اما Manus؟ این معماری با سایر سیستمهای مبتنی بر عامل که تمایل دارند MCP را به عنوان پروتکل خود بپذیرند، بسیار متفاوت است.
بنابراین، بیایید یک قدم به عقب برداریم و انتقادی فکر کنیم: چرا Manus این رویکرد منحصر به فرد را در پیش میگیرد؟ مزایا و معایب MCP چیست؟ و چه زمانی استفاده یا اجتناب از آن منطقی است؟
آشنایی با MCP
اگر مراقب دنیای هوش مصنوعی بودهاید، احتمالاً متوجه هیاهوی ناگهانی پیرامون MCP شدهاید. اخیراً، کل خبرنامه من پر از افرادی بود که درباره MCP بحث میکردند، میپرسیدند چیست، یا فقط تعجب میکردند که چرا ترند شده است. برخی میگفتند Cursor + MCP بر همه چیز حکومت میکند. با وجود اینکه این مفهوم فقط چند ماه پیش ظهور کرده است، در حال حاضر چند سرور MCP و حتی کاتالوگهای خدمات MCP وجود دارد.
اما جدی - MCP اصلاً چیست؟ بیایید نگاهی دقیقتر بیندازیم.
توسعه عاملمحور به طور گسترده به عنوان کلید آینده در نظر گرفته میشود و هوش مصنوعی مولد را قادر میسازد تا فراتر از یک چتبات تکامل یابد. با این رویکرد، برنامههای هوش مصنوعی میتوانند به طور فعال اطلاعات را جمع آوری کنند، محیط را درک کنند، در صورت نیاز از ابزارهای جدید استفاده کنند و در طول زمان یاد بگیرند.
پروتکل مدل زمینه (MCP) یک پروتکل طراحی شده برای سازماندهی و ایجاد سیستمهای عاملمحور است. این از رویکرد معمولی متفاوت است که در آن اطلاعات در یک پایگاه داده متمرکز ذخیره میشوند. در عوض، به عوامل اجازه میدهد تا از قطعات مختلف اطلاعات ("زمینه") که میتوانند در طول زمان با یکدیگر ادغام شوند، استفاده کنند.
بزرگترین نقطه فروش این است که به شما امکان میدهد سیستمهای پیچیده با قابلیت استفاده مجدد ایجاد کنید که میتوانند بهطور مقیاسپذیر و قابل اعتماد اطلاعات را مدیریت کنند. این پشته فناوری با اتکا به پیامها و سیستم عاملهای از راه دور بدون حالت، استدلال را به رویکردهای عملکرد سنتیتر نزدیک میکند. یکی دیگر از مزایای مهم این است که به شما امکان میدهد اجزای داخلی سیستم را به صورت جداگانه آزمایش کنید.
هدف MCP یک سیستم مدیریت اطلاعات است که از دو ویژگی اصلی استفاده میکند:
- زمینه: قطعات اطلاعاتی مجزا
- پروتکل: مجموعهای از قواعد و دستورالعملها برای نحوه تعامل عوامل و تبادل زمینه
از دیدگاه مهندسی، MCP را میتوان به عنوان یک سیستم عمل از راه دور بدون حالت در نظر گرفت.
وارد CodeAct شوید
با این حال، MCP تنها بازی موجود در شهر نیست. معماری دیگری به نام CodeAct وجود دارد.
این معماری بر اساس این ایده ساخته شده است که عوامل در حال کدگذاری و رمزگشایی در حین عمل هستند. هر عامل دارای کدی است که نحوه رفتار آن را تعیین میکند، و میتواند از این کد برای استدلال در مورد اعمال و اعمال خودش، و همچنین اعمال سایر عوامل استفاده کند.
عامل A میتواند دادهها را با استفاده از کد خودش رمزگذاری کند، و سپس عامل B میتواند کد عامل A را دریافت کند و سپس دادهها را با استفاده از کد خودش رمزگشایی کند، اما با کد عامل A. CodeAct به شما انعطافپذیری میدهد تا عملیات روی هر دو عامل جدا شوند و سپس با هم ادغام شوند.
این امر امکان ایجاد سیستمهای مقیاسپذیرتر و قابل انعطافتر را فراهم میکند، زیرا عوامل به یکدیگر وابسته نیستند و میتوانند بهطور مستقل تکامل یابند.
مزایا و معایب
بنابراین، کدام یک بهتر است؟
MCP یک گزینه عالی برای سیستمهایی است که به قابلیت استفاده مجدد، ماژولاریتی و مقیاسپذیری نیاز دارند. همچنین برای سیستمهایی که به دادههای سلسله مراتبی و توزیعشده نیاز دارند مناسب است.
از طرف دیگر، CodeAct یک گزینه عالی برای سیستمهایی است که به انعطافپذیری و قابلیت استفاده مجدد نیاز دارند، جایی که باید بین اجزای مختلف استقلال وجود داشته باشد. همچنین برای سیستمهایی که به دادههای همتا به همتا نیاز دارند مناسب است.
با این حال، هر دو معماری دارای مضراتی هستند. MCP میتواند درک و استدلال در مورد آن دشوار باشد، و میتواند در هنگام استقرار، به نگهداری زیادی نیاز داشته باشد. CodeAct میتواند پیادهسازی و آزمایش آن دشوار باشد، و میتواند در هنگام کارکرد از نظر محاسباتی گران باشد. شما باید مزایا و معایب را وزن کنید تا بفهمید کدام یک برای شما مناسب است.
در نهایت، انتخاب بین MCP و CodeAct به نیازها و اولویتهای خاص شما بستگی دارد. هیچ پاسخ درستی یا غلطی وجود ندارد. شما باید معماری را انتخاب کنید که برای مورد استفاده شما بهترین باشد.