پروتکل متن مدل (MCP یا Model Context Protocol) - یک استاندارد متنباز رو به رشد که برای کمک به تعامل بینقص عاملهای هوش مصنوعی با ابزارها، دادهها و رابطها طراحی شده است - به تازگی به نقطه عطف مهمی دست یافته است. امروز، توسعهدهندگان پشت این ابتکار، نسخه بهروزرسانی شده مشخصات MCP را نهایی کردند و ارتقاهای کلیدی را برای امنتر، توانمندتر و قابل همکاریتر کردن عاملهای هوش مصنوعی معرفی نمودند.
در اقدامی بسیار مهم، OpenAI، پیشرو صنعت در هوش مصنوعی مولد، امروز پس از اعلامیه MCP، اعلام کرد که پشتیبانی از MCP را در تمام محصولات خود اضافه میکند. سم آلتمن، مدیرعامل OpenAI، گفت که این پشتیبانی از امروز در کیت توسعه نرمافزار (SDK) عاملهای OpenAI در دسترس است و پشتیبانی برای اپلیکیشن دسکتاپ ChatGPT و Responses API به زودی ارائه خواهد شد.
مایکروسافت همزمان با این انتشار، پشتیبانی خود از MCP را اعلام کرد، از جمله راهاندازی یک سرور Playwright-MCP جدید که به عاملهای هوش مصنوعی مانند Claude اجازه میدهد تا با استفاده از درخت دسترسیپذیری (accessibility tree) کروم، وب را مرور کرده و با سایتها تعامل داشته باشند.
الکس آلبرت، یکی از مشارکتکنندگان کلیدی در پروژه MCP، در پستی در توییتر گفت: «این نسخه جدید جهشی بزرگ برای ارتباط عامل-ابزار است. و اینکه مایکروسافت در حال ساخت زیرساختهای دنیای واقعی بر اساس آن است، نشان میدهد که این اکوسیستم با چه سرعتی در حال تکامل است.»
چه چیزی در نسخه بهروز شده MCP جدید است؟
بهروزرسانی ۲۶ مارس چندین تغییر مهم در سطح پروتکل را به همراه دارد:
- چارچوب احراز هویت مبتنی بر OAuth 2.1: یک استاندارد قوی برای ایمنسازی ارتباط عامل-سرور، بهویژه در انتقالهای مبتنی بر HTTP اضافه میکند.
- انتقال HTTP قابل استریم (Streamable): جایگزین تنظیم قدیمیتر HTTP+SSE میشود و جریان داده دوطرفه و بیدرنگ را با سازگاری بهتر امکانپذیر میسازد.
- دستهبندی JSON-RPC: به کلاینتها اجازه میدهد چندین درخواست را به یکباره ارسال کنند، که کارایی را بهبود بخشیده و تأخیر در تعاملات عامل-ابزار را کاهش میدهد.
- حاشیهنویسی ابزار (Tool Annotations): فرادادههای غنی برای توصیف رفتار ابزار اضافه میکند که امکان کشف و استدلال خلاقانهتر توسط عاملهای هوش مصنوعی را فراهم میسازد.
این پروتکل از یک پایه ماژولار JSON-RPC 2.0 استفاده میکند، با معماری لایهای که انتقال هسته، مدیریت چرخه عمر، ویژگیهای سرور (مانند منابع و پرامپتها) و ویژگیهای کلاینت (مانند نمونهبرداری یا ثبت وقایع) را از هم جدا میکند. توسعهدهندگان میتوانند بسته به مورد استفاده خود، اجزای مورد نظر را برای پیادهسازی انتخاب کنند.
مشارکت مایکروسافت: اتوماسیون مرورگر از طریق MCP
دو روز پیش، مایکروسافت Playwright-MCP را منتشر کرد، سروری که ابزار قدرتمند اتوماسیون مرورگر خود را در استاندارد MCP بستهبندی میکند. این بدان معناست که عاملهای هوش مصنوعی مانند Claude اکنون میتوانند فراتر از صحبت کردن عمل کنند - آنها میتوانند کلیک کنند، تایپ کنند، مرور کنند و مانند کاربران واقعی با وب تعامل داشته باشند.
این ادغام که بر اساس درخت دسترسیپذیری (accessibility tree) کروم ساخته شده است، به Claude اجازه میدهد تا به محتویات صفحه دسترسی پیدا کرده و آن را به شکلی قابل خواندن برای انسان توصیف کند. مجموعه ابزار موجود شامل موارد زیر است:
- پیمایش (Navigation): browser_navigate، go_back، go_forward
- ورودی (Input): browser_type، browser_click، browser_press_key
- عکس فوری (Snapshots): browser_snapshot، browser_screenshot
- تعاملات مبتنی بر عنصر (Element-based interactions) با استفاده از توصیفگرهای دسترسیپذیری
این قابلیت هر عامل هوش مصنوعی سازگار را به یک ربات تست اتوماسیون، دستیار تضمین کیفیت (QA) یا ناوبر داده تبدیل میکند.
راهاندازی آسان است: کاربران به سادگی Playwright را به عنوان یک دستور در فایل claude_desktop_config.json اضافه میکنند و برنامه Claude Desktop ابزارها را در زمان اجرا تشخیص میدهد.
تصویر بزرگتر: قابلیت همکاری در مقیاس بزرگ
شرکت Anthropic ابتدا MCP را در اواخر سال ۲۰۲۳ معرفی کرد تا یک مشکل رو به رشد را حل کند: عاملهای هوش مصنوعی نیاز به تعامل با ابزارهای دنیای واقعی دارند، اما هر برنامه به «زبان» متفاوتی صحبت میکند. MCP قصد دارد با ارائه یک پروتکل استاندارد برای توصیف و استفاده از ابزارها در سراسر اکوسیستمها، این مشکل را برطرف کند.
با حمایت Anthropic، LangChain و اکنون مایکروسافت، MCP به عنوان یک رقیب جدی برای تبدیل شدن به لایه استاندارد اتصال عاملها در حال ظهور است. از آنجایی که MCP ابتدا توسط Anthropic راهاندازی شد، این سوال باقی بود که آیا بزرگترین رقیب Anthropic، یعنی OpenAI، از این پروتکل پشتیبانی خواهد کرد یا خیر. و البته، مایکروسافت، متحد بزرگ OpenAI، علامت سوال دیگری بود. این واقعیت که هر دو بازیگر از پروتکل پشتیبانی کردهاند نشان میدهد که حرکت در میان جوامع سازمانی و متنباز در حال افزایش است. خود OpenAI نیز اکوسیستم خود را پیرامون عاملها باز کرده است، از جمله با جدیدترین SDK عاملهای خود که یک هفته پیش اعلام شد - و این حرکت حمایت از فرمتهای API OpenAI را به عنوان یک استاندارد تقویت کرده است، با توجه به اینکه دیگران مانند Anthropic و Google نیز از آن پیروی کردهاند. بنابراین با پشتیبانی از فرمتهای API OpenAI و MCP، استانداردسازی طی چند هفته گذشته شاهد پیروزی بزرگی بوده است.
الکساندر دوریا، همبنیانگذار استارتآپ هوش مصنوعی Pleias، در توییتی نوشت: «ما در حال ورود به عصر پروتکل هوش مصنوعی هستیم. اینگونه است که عاملها واقعاً کارها را *انجام* خواهند داد.»
گام بعدی چیست؟
با انتشار MCP 0.2 و پشتیبانی ملموس مایکروسافت، زمینه برای نسل جدیدی از عاملها فراهم میشود که میتوانند به طور امن و انعطافپذیر در سراسر پشته (stack) فکر و عمل کنند.
سوال بزرگ اکنون این است: آیا دیگران پیروی خواهند کرد؟ اگر Meta، آمازون یا اپل به آن بپیوندند، MCP به زودی میتواند به «زبان» جهانی اقدامات هوش مصنوعی تبدیل شود.
در حال حاضر، این روز بزرگی برای اکوسیستم عاملها است - روزی که نوید قابلیت همکاری هوش مصنوعی را به واقعیت نزدیکتر میکند.