گوگل با چارچوب جدید Agent2Agent (A2A) گامی بزرگ در جهت تعیین استاندارد ارتباطی برای چشمانداز در حال تحول هوش مصنوعی برداشته است. هدف A2A این است که ایجنتهای هوش مصنوعی را قادر سازد تا در سیستمها و برنامههای مختلف با یکدیگر ارتباط برقرار کرده و همکاری کنند. در اینجا نحوه عملکرد A2A و اهمیت آن برای آینده همکاری هوش مصنوعی آورده شده است.
A2A چیست؟
چارچوب Agent2Agent (A2A) گوگل یک استاندارد باز برای ارتباط بین ایجنتهای مستقل هوش مصنوعی ارائه میدهد. آن را به عنوان یک پروتکل در نظر بگیرید که به ایجنتهایی که توسط فروشندگان مختلف و با استفاده از فناوریهای مختلف ساخته شدهاند، اجازه میدهد تا با یکدیگر صحبت کنند، همانطور که شبکه جهانی وب از مجموعهای از خدمات ایجاد شده است که میتوانند بدون در نظر گرفتن فناوری زیربنایی با یکدیگر تعامل داشته باشند.
هدف اصلی A2A شکستن موانعی است که در حال حاضر ایجنتهای هوش مصنوعی را در یک شرکت از هم جدا میکند. به عنوان مثال، فرض کنید یک شرکت ایجنتهای هوش مصنوعی را بر روی مدلهای زبانی بزرگ مختلف (LLM) و پلتفرمهای مختلف ایجاد کرده است. در این صورت، این ایجنتها باید بتوانند بدون نیاز به تغییر، برای انجام وظایف با یکدیگر همکاری کنند.
هدف از این همکاری افزایش چشمگیر استقلال ایجنت، افزایش بهرهوری و کاهش هزینههای عملیاتی برای مشاغلی است که به اتوماسیون هوش مصنوعی متکی هستند. گوگل A2A را با پشتیبانی بیش از 50 شریک، از جمله فروشندگان بزرگ فناوری و ارائه دهندگان خدمات، راه اندازی کرده است.
A2A چگونه کار میکند؟
A2A یک روش ساختاریافته برای تعامل یک ایجنت "مشتری" (یکی که درخواست کمک میکند) با یک ایجنت "از راه دور" (یکی که یک کار را انجام میدهد) تعریف میکند. این تعامل متکی به چندین جزء کلیدی است:
کشف ایجنت (کارت ایجنت): برای اینکه ایجنتها با یکدیگر همکاری کنند، ابتدا باید یکدیگر را پیدا کرده و قابلیتها را درک کنند. A2A از یک "کارت ایجنت" استفاده میکند، یک فایل JSON استاندارد که هر ایجنت از راه دور منتشر میکند. این کارت جزئیات نام، توضیحات، مهارتها، حالتهای ارتباطی پشتیبانی شده (مانند متن، صدا یا ویدئو) و الزامات احراز هویت ایجنت را شرح میدهد. ایجنتهای مشتری از این کارتها برای شناسایی ایجنتهای از راه دور مناسب برای وظایف خاص استفاده میکنند. ایجنتهای A2A میتوانند از طریق یک URL شناخته شده (/.well-known/agent.json) یا از طریق رجیستریهای ایجنت سازمانی انتخاب شده، یکدیگر را کشف کنند.
وظایف: واحد اساسی کار در A2A "وظیفه" است. هنگامی که یک ایجنت مشتری به انجام کاری نیاز دارد، یک وظیفه را آغاز میکند و آن را به ایجنت از راه دور انتخابی میفرستد. پروتکل A2A ساختار این شیء وظیفه را تعریف میکند و چرخه عمر آن را ردیابی میکند. این به هر دو ایجنت اجازه میدهد تا همگام بمانند، چه کار به سرعت انجام شود و چه به ساعتها یا روزها نیاز داشته باشد (به خصوص اگر ورودی انسانی مورد نیاز باشد). خروجی یا نتیجه یک کار تکمیل شده "مصنوع" نامیده میشود.
ارتباطات (پیامها و مصنوعات): ایجنتها از طریق "پیامها"ی ساختاریافته اطلاعات را تبادل میکنند. این پیامها میتوانند حاوی متن، دستورالعملها، پاسخها یا مصنوع نهایی باشند.
بهروزرسانیها برای وظایف طولانی مدت: برای وظایفی که فوری نیستند، A2A از مکانیسمهایی برای اطلاع رسانی به مشتری توسط ایجنت از راه دور پشتیبانی میکند. ایجنتهای از راه دور میتوانند از طریق رویدادهای ارسال شده از سرور (SSE) در صورت وجود اتصال دائمی، یا به طور بالقوه از طریق سیستمهای اعلان خارجی، بهروزرسانیهای وضعیت را ارسال کنند.
کاربری را در نظر بگیرید که از ایجنت تحقیق اصلی خود (مشتری) میخواهد گزارشی در مورد روندهای اخیر بازار برای یک صنعت خاص و ارتباط آنها با شرکت تهیه کند.
ایجنت مشتری درخواست را تفسیر میکند و نیاز به جستجو در وب، تجزیه و تحلیل دادههای داخلی و نوشتن یک پیش نویس گزارش را شناسایی میکند. با استفاده از کشف A2A (کارتهای ایجنت)، ایجنتهای از راه دور تخصصی را پیدا میکند: یکی ماهر در خزیدن در وب، دیگری در تجزیه و تحلیل آماری و سومی در ساختاربندی اسناد.
ایجنت مشتری "وظایف" متمایز A2A را برای هر ایجنت از راه دور آغاز میکند: وظیفه 1 (جمع آوری مقالات/دادههای مرتبط) به ایجنت جستجوی وب میرود، وظیفه 2 (تجزیه و تحلیل مجموعه داده داخلی) به ایجنت تجزیه و تحلیل میرود.
هر ایجنت از راه دور وظیفه اختصاص داده شده خود را انجام میدهد. ایجنت جستجو پیوندها و متن استخراج شده وب را به عنوان "مصنوع" برمی گرداند. ایجنت تجزیه و تحلیل نمودارها و یافتههای کلیدی را به عنوان مصنوع خود برمی گرداند. اینها از طریق "پیامهای" A2A به ایجنت مشتری ارسال میشوند.
ایجنت مشتری ممکن است وظیفه 3 را آغاز کند و مصنوعات جمع آوری شده را برای تهیه پیش نویس بخشها به ایجنت ساختاربندی گزارش ارسال کند. این ایجنت یک بخش سند قالب بندی شده را به عنوان مصنوع خود برمی گرداند. در طول فرآیند، با جمع آوری اطلاعات جدید توسط ایجنت، ممکن است با گزارشهایی در مورد پیشرفت خود به کاربر بازگردد و سوالات واضح کننده را مطرح کند و مسیر را اصلاح کند. اگر فرآیند تحقیق طولانی باشد، ایجنتهای از راه دور میتوانند بهروزرسانیهای وضعیت را از طریق A2A در طول اجرای وظیفه خود ارائه دهند.
در نهایت، ایجنت مشتری اصلی مصنوعات دریافت شده از تمام ایجنتهای از راه دور را در یک گزارش نهایی منسجم برای کاربر جمع آوری میکند. سپس کاربر ممکن است تصمیم بگیرد که میخواهد یک وب سایت تعاملی ایجاد کند که پیمایش محتوا و نمودارهای داده در گزارش را آسانتر کند. برای این کار، کاربر با ایجنت از راه دور دیگری که قابلیتهای توسعه وب را دارد تماس میگیرد و به او دستور میدهد یک وب سایت برای گزارش ایجاد کند و آن را در سرور داخلی شرکت میزبانی کند.
هر یک از این ایجنتها ممکن است روی پلتفرمهای مختلف اجرا شوند. به عنوان مثال، ایجنت اصلی ممکن است با استفاده از Gemini 2.5 Pro در Google Cloud اجرا شود. ایجنت تجزیه و تحلیل دادهها ممکن است توسط یک مدل وزن باز تامین شود و در سرورهای خود شرکت اجرا شود، جایی که میتواند به دادههای اختصاصی دسترسی داشته باشد. ایجنتهای گزارش و توسعهدهنده وب ممکن است از Claude 3.7 Sonnet استفاده کنند و در Amazon Bedrock اجرا شوند.
به لطف پروتکلی مانند A2A، این ایجنتهای مختلف میتوانند به طور شفاف در سراسر ارائهدهندگان مختلف با یکدیگر کار کنند.