اعتبار: VentureBeat با استفاده از Midjourney
اعتبار: VentureBeat با استفاده از Midjourney

پروتکل متن مدل (MCP) متن‌باز به‌روزرسانی شد — چرا این یک اتفاق مهم است

پروتکل متن مدل (MCP یا Model Context Protocol) - یک استاندارد متن‌باز رو به رشد که برای کمک به تعامل بی‌نقص عامل‌های هوش مصنوعی با ابزارها، داده‌ها و رابط‌ها طراحی شده است - به تازگی به نقطه عطف مهمی دست یافته است. امروز، توسعه‌دهندگان پشت این ابتکار، نسخه به‌روزرسانی شده مشخصات MCP را نهایی کردند و ارتقاهای کلیدی را برای امن‌تر، توانمندتر و قابل همکاری‌تر کردن عامل‌های هوش مصنوعی معرفی نمودند.

در اقدامی بسیار مهم، OpenAI، پیشرو صنعت در هوش مصنوعی مولد، امروز پس از اعلامیه MCP، اعلام کرد که پشتیبانی از MCP را در تمام محصولات خود اضافه می‌کند. سم آلتمن، مدیرعامل OpenAI، گفت که این پشتیبانی از امروز در کیت توسعه نرم‌افزار (SDK) عامل‌های OpenAI در دسترس است و پشتیبانی برای اپلیکیشن دسکتاپ ChatGPT و Responses API به زودی ارائه خواهد شد.

مایکروسافت همزمان با این انتشار، پشتیبانی خود از MCP را اعلام کرد، از جمله راه‌اندازی یک سرور Playwright-MCP جدید که به عامل‌های هوش مصنوعی مانند Claude اجازه می‌دهد تا با استفاده از درخت دسترسی‌پذیری (accessibility tree) کروم، وب را مرور کرده و با سایت‌ها تعامل داشته باشند.

الکس آلبرت، یکی از مشارکت‌کنندگان کلیدی در پروژه MCP، در پستی در توییتر گفت: «این نسخه جدید جهشی بزرگ برای ارتباط عامل-ابزار است. و اینکه مایکروسافت در حال ساخت زیرساخت‌های دنیای واقعی بر اساس آن است، نشان می‌دهد که این اکوسیستم با چه سرعتی در حال تکامل است.»

چه چیزی در نسخه به‌روز شده MCP جدید است؟

به‌روزرسانی ۲۶ مارس چندین تغییر مهم در سطح پروتکل را به همراه دارد:

  • چارچوب احراز هویت مبتنی بر OAuth 2.1: یک استاندارد قوی برای ایمن‌سازی ارتباط عامل-سرور، به‌ویژه در انتقال‌های مبتنی بر HTTP اضافه می‌کند.
  • انتقال HTTP قابل استریم (Streamable): جایگزین تنظیم قدیمی‌تر HTTP+SSE می‌شود و جریان داده دوطرفه و بی‌درنگ را با سازگاری بهتر امکان‌پذیر می‌سازد.
  • دسته‌بندی JSON-RPC: به کلاینت‌ها اجازه می‌دهد چندین درخواست را به یکباره ارسال کنند، که کارایی را بهبود بخشیده و تأخیر در تعاملات عامل-ابزار را کاهش می‌دهد.
  • حاشیه‌نویسی ابزار (Tool Annotations): فراداده‌های غنی برای توصیف رفتار ابزار اضافه می‌کند که امکان کشف و استدلال خلاقانه‌تر توسط عامل‌های هوش مصنوعی را فراهم می‌سازد.
اسکرین‌شات از یک چت که نشان می‌دهد محتوای تولید شده توسط هوش مصنوعی ممکن است نادرست باشد.
شکل ۱: دسکتاپ کلود (Claude Desktop) با استفاده از Playwright-MCP برای پیمایش و توصیف datasette.io، که اتوماسیون وب با قدرت پروتکل متن مدل را نشان می‌دهد.

این پروتکل از یک پایه ماژولار JSON-RPC 2.0 استفاده می‌کند، با معماری لایه‌ای که انتقال هسته، مدیریت چرخه عمر، ویژگی‌های سرور (مانند منابع و پرامپت‌ها) و ویژگی‌های کلاینت (مانند نمونه‌برداری یا ثبت وقایع) را از هم جدا می‌کند. توسعه‌دهندگان می‌توانند بسته به مورد استفاده خود، اجزای مورد نظر را برای پیاده‌سازی انتخاب کنند.

مشارکت مایکروسافت: اتوماسیون مرورگر از طریق MCP

دو روز پیش، مایکروسافت Playwright-MCP را منتشر کرد، سروری که ابزار قدرتمند اتوماسیون مرورگر خود را در استاندارد MCP بسته‌بندی می‌کند. این بدان معناست که عامل‌های هوش مصنوعی مانند Claude اکنون می‌توانند فراتر از صحبت کردن عمل کنند - آنها می‌توانند کلیک کنند، تایپ کنند، مرور کنند و مانند کاربران واقعی با وب تعامل داشته باشند.

این ادغام که بر اساس درخت دسترسی‌پذیری (accessibility tree) کروم ساخته شده است، به Claude اجازه می‌دهد تا به محتویات صفحه دسترسی پیدا کرده و آن را به شکلی قابل خواندن برای انسان توصیف کند. مجموعه ابزار موجود شامل موارد زیر است:

  • پیمایش (Navigation): browser_navigate، go_back، go_forward
  • ورودی (Input): browser_type، browser_click، browser_press_key
  • عکس فوری (Snapshots): browser_snapshot، browser_screenshot
  • تعاملات مبتنی بر عنصر (Element-based interactions) با استفاده از توصیف‌گرهای دسترسی‌پذیری

این قابلیت هر عامل هوش مصنوعی سازگار را به یک ربات تست اتوماسیون، دستیار تضمین کیفیت (QA) یا ناوبر داده تبدیل می‌کند.

راه‌اندازی آسان است: کاربران به سادگی Playwright را به عنوان یک دستور در فایل claude_desktop_config.json اضافه می‌کنند و برنامه Claude Desktop ابزارها را در زمان اجرا تشخیص می‌دهد.

تصویر بزرگتر: قابلیت همکاری در مقیاس بزرگ

دیاگرام طراحی ماژولار پروتکل MCP
شکل ۲: طراحی ماژولار MCP به توسعه‌دهندگان امکان می‌دهد فقط لایه‌های مورد نیاز خود را پیاده‌سازی کنند، در حالی که سازگاری حفظ می‌شود.

شرکت Anthropic ابتدا MCP را در اواخر سال ۲۰۲۳ معرفی کرد تا یک مشکل رو به رشد را حل کند: عامل‌های هوش مصنوعی نیاز به تعامل با ابزارهای دنیای واقعی دارند، اما هر برنامه به «زبان» متفاوتی صحبت می‌کند. MCP قصد دارد با ارائه یک پروتکل استاندارد برای توصیف و استفاده از ابزارها در سراسر اکوسیستم‌ها، این مشکل را برطرف کند.

با حمایت Anthropic، LangChain و اکنون مایکروسافت، MCP به عنوان یک رقیب جدی برای تبدیل شدن به لایه استاندارد اتصال عامل‌ها در حال ظهور است. از آنجایی که MCP ابتدا توسط Anthropic راه‌اندازی شد، این سوال باقی بود که آیا بزرگترین رقیب Anthropic، یعنی OpenAI، از این پروتکل پشتیبانی خواهد کرد یا خیر. و البته، مایکروسافت، متحد بزرگ OpenAI، علامت سوال دیگری بود. این واقعیت که هر دو بازیگر از پروتکل پشتیبانی کرده‌اند نشان می‌دهد که حرکت در میان جوامع سازمانی و متن‌باز در حال افزایش است. خود OpenAI نیز اکوسیستم خود را پیرامون عامل‌ها باز کرده است، از جمله با جدیدترین SDK عامل‌های خود که یک هفته پیش اعلام شد - و این حرکت حمایت از فرمت‌های API OpenAI را به عنوان یک استاندارد تقویت کرده است، با توجه به اینکه دیگران مانند Anthropic و Google نیز از آن پیروی کرده‌اند. بنابراین با پشتیبانی از فرمت‌های API OpenAI و MCP، استانداردسازی طی چند هفته گذشته شاهد پیروزی بزرگی بوده است.

الکساندر دوریا، هم‌بنیان‌گذار استارت‌آپ هوش مصنوعی Pleias، در توییتی نوشت: «ما در حال ورود به عصر پروتکل هوش مصنوعی هستیم. اینگونه است که عامل‌ها واقعاً کارها را *انجام* خواهند داد.»

گام بعدی چیست؟

با انتشار MCP 0.2 و پشتیبانی ملموس مایکروسافت، زمینه برای نسل جدیدی از عامل‌ها فراهم می‌شود که می‌توانند به طور امن و انعطاف‌پذیر در سراسر پشته (stack) فکر و عمل کنند.

دیاگرام جریان مجوز OAuth 2.1 در پروتکل متن مدل (MCP)
شکل ۳: جریان مجوز OAuth 2.1 در پروتکل متن مدل (MCP)

سوال بزرگ اکنون این است: آیا دیگران پیروی خواهند کرد؟ اگر Meta، آمازون یا اپل به آن بپیوندند، MCP به زودی می‌تواند به «زبان» جهانی اقدامات هوش مصنوعی تبدیل شود.

در حال حاضر، این روز بزرگی برای اکوسیستم عامل‌ها است - روزی که نوید قابلیت همکاری هوش مصنوعی را به واقعیت نزدیک‌تر می‌کند.