تصویر تولید شده با Imagen 3
تصویر تولید شده با Imagen 3

چگونه Agent2Agent گوگل می‌تواند بهره‌وری هوش مصنوعی را از طریق ارتباط بین ایجنت‌ها افزایش دهد

Agent2Agent گوگل
Agent2Agent گوگل (منبع: گوگل)
کارت ایجنت
نمونه‌ای از کارت ایجنت (بخش)
نمونه A2A
نمونه گردش کار A2A

گوگل با چارچوب جدید Agent2Agent (A2A) گامی بزرگ در جهت تعیین استاندارد ارتباطی برای چشم‌انداز در حال تحول هوش مصنوعی برداشته است. هدف A2A این است که ایجنت‌های هوش مصنوعی را قادر سازد تا در سیستم‌ها و برنامه‌های مختلف با یکدیگر ارتباط برقرار کرده و همکاری کنند. در اینجا نحوه عملکرد A2A و اهمیت آن برای آینده همکاری هوش مصنوعی آورده شده است.

A2A چیست؟

چارچوب Agent2Agent (A2A) گوگل یک استاندارد باز برای ارتباط بین ایجنت‌های مستقل هوش مصنوعی ارائه می‌دهد. آن را به عنوان یک پروتکل در نظر بگیرید که به ایجنت‌هایی که توسط فروشندگان مختلف و با استفاده از فناوری‌های مختلف ساخته شده‌اند، اجازه می‌دهد تا با یکدیگر صحبت کنند، همانطور که شبکه جهانی وب از مجموعه‌ای از خدمات ایجاد شده است که می‌توانند بدون در نظر گرفتن فناوری زیربنایی با یکدیگر تعامل داشته باشند.

هدف اصلی A2A شکستن موانعی است که در حال حاضر ایجنت‌های هوش مصنوعی را در یک شرکت از هم جدا می‌کند. به عنوان مثال، فرض کنید یک شرکت ایجنت‌های هوش مصنوعی را بر روی مدل‌های زبانی بزرگ مختلف (LLM) و پلتفرم‌های مختلف ایجاد کرده است. در این صورت، این ایجنت‌ها باید بتوانند بدون نیاز به تغییر، برای انجام وظایف با یکدیگر همکاری کنند.

هدف از این همکاری افزایش چشمگیر استقلال ایجنت، افزایش بهره‌وری و کاهش هزینه‌های عملیاتی برای مشاغلی است که به اتوماسیون هوش مصنوعی متکی هستند. گوگل A2A را با پشتیبانی بیش از 50 شریک، از جمله فروشندگان بزرگ فناوری و ارائه دهندگان خدمات، راه اندازی کرده است.

A2A چگونه کار می‌کند؟

A2A یک روش ساختاریافته برای تعامل یک ایجنت "مشتری" (یکی که درخواست کمک می‌کند) با یک ایجنت "از راه دور" (یکی که یک کار را انجام می‌دهد) تعریف می‌کند. این تعامل متکی به چندین جزء کلیدی است:

کشف ایجنت (کارت ایجنت): برای اینکه ایجنت‌ها با یکدیگر همکاری کنند، ابتدا باید یکدیگر را پیدا کرده و قابلیت‌ها را درک کنند. A2A از یک "کارت ایجنت" استفاده می‌کند، یک فایل JSON استاندارد که هر ایجنت از راه دور منتشر می‌کند. این کارت جزئیات نام، توضیحات، مهارت‌ها، حالت‌های ارتباطی پشتیبانی شده (مانند متن، صدا یا ویدئو) و الزامات احراز هویت ایجنت را شرح می‌دهد. ایجنت‌های مشتری از این کارت‌ها برای شناسایی ایجنت‌های از راه دور مناسب برای وظایف خاص استفاده می‌کنند. ایجنت‌های A2A می‌توانند از طریق یک URL شناخته شده (/.well-known/agent.json) یا از طریق رجیستری‌های ایجنت سازمانی انتخاب شده، یکدیگر را کشف کنند.

وظایف: واحد اساسی کار در A2A "وظیفه" است. هنگامی که یک ایجنت مشتری به انجام کاری نیاز دارد، یک وظیفه را آغاز می‌کند و آن را به ایجنت از راه دور انتخابی می‌فرستد. پروتکل A2A ساختار این شیء وظیفه را تعریف می‌کند و چرخه عمر آن را ردیابی می‌کند. این به هر دو ایجنت اجازه می‌دهد تا همگام بمانند، چه کار به سرعت انجام شود و چه به ساعت‌ها یا روزها نیاز داشته باشد (به خصوص اگر ورودی انسانی مورد نیاز باشد). خروجی یا نتیجه یک کار تکمیل شده "مصنوع" نامیده می‌شود.

ارتباطات (پیام‌ها و مصنوعات): ایجنت‌ها از طریق "پیام‌ها"ی ساختاریافته اطلاعات را تبادل می‌کنند. این پیام‌ها می‌توانند حاوی متن، دستورالعمل‌ها، پاسخ‌ها یا مصنوع نهایی باشند.

به‌روزرسانی‌ها برای وظایف طولانی مدت: برای وظایفی که فوری نیستند، A2A از مکانیسم‌هایی برای اطلاع رسانی به مشتری توسط ایجنت از راه دور پشتیبانی می‌کند. ایجنت‌های از راه دور می‌توانند از طریق رویدادهای ارسال شده از سرور (SSE) در صورت وجود اتصال دائمی، یا به طور بالقوه از طریق سیستم‌های اعلان خارجی، به‌روزرسانی‌های وضعیت را ارسال کنند.

کاربری را در نظر بگیرید که از ایجنت تحقیق اصلی خود (مشتری) می‌خواهد گزارشی در مورد روندهای اخیر بازار برای یک صنعت خاص و ارتباط آنها با شرکت تهیه کند.

ایجنت مشتری درخواست را تفسیر می‌کند و نیاز به جستجو در وب، تجزیه و تحلیل داده‌های داخلی و نوشتن یک پیش نویس گزارش را شناسایی می‌کند. با استفاده از کشف A2A (کارت‌های ایجنت)، ایجنت‌های از راه دور تخصصی را پیدا می‌کند: یکی ماهر در خزیدن در وب، دیگری در تجزیه و تحلیل آماری و سومی در ساختاربندی اسناد.

ایجنت مشتری "وظایف" متمایز A2A را برای هر ایجنت از راه دور آغاز می‌کند: وظیفه 1 (جمع آوری مقالات/داده‌های مرتبط) به ایجنت جستجوی وب می‌رود، وظیفه 2 (تجزیه و تحلیل مجموعه داده داخلی) به ایجنت تجزیه و تحلیل می‌رود.

هر ایجنت از راه دور وظیفه اختصاص داده شده خود را انجام می‌دهد. ایجنت جستجو پیوندها و متن استخراج شده وب را به عنوان "مصنوع" برمی گرداند. ایجنت تجزیه و تحلیل نمودارها و یافته‌های کلیدی را به عنوان مصنوع خود برمی گرداند. اینها از طریق "پیام‌های" A2A به ایجنت مشتری ارسال می‌شوند.

ایجنت مشتری ممکن است وظیفه 3 را آغاز کند و مصنوعات جمع آوری شده را برای تهیه پیش نویس بخش‌ها به ایجنت ساختاربندی گزارش ارسال کند. این ایجنت یک بخش سند قالب بندی شده را به عنوان مصنوع خود برمی گرداند. در طول فرآیند، با جمع آوری اطلاعات جدید توسط ایجنت، ممکن است با گزارش‌هایی در مورد پیشرفت خود به کاربر بازگردد و سوالات واضح کننده را مطرح کند و مسیر را اصلاح کند. اگر فرآیند تحقیق طولانی باشد، ایجنت‌های از راه دور می‌توانند به‌روزرسانی‌های وضعیت را از طریق A2A در طول اجرای وظیفه خود ارائه دهند.

در نهایت، ایجنت مشتری اصلی مصنوعات دریافت شده از تمام ایجنت‌های از راه دور را در یک گزارش نهایی منسجم برای کاربر جمع آوری می‌کند. سپس کاربر ممکن است تصمیم بگیرد که می‌خواهد یک وب سایت تعاملی ایجاد کند که پیمایش محتوا و نمودارهای داده در گزارش را آسان‌تر کند. برای این کار، کاربر با ایجنت از راه دور دیگری که قابلیت‌های توسعه وب را دارد تماس می‌گیرد و به او دستور می‌دهد یک وب سایت برای گزارش ایجاد کند و آن را در سرور داخلی شرکت میزبانی کند.

هر یک از این ایجنت‌ها ممکن است روی پلتفرم‌های مختلف اجرا شوند. به عنوان مثال، ایجنت اصلی ممکن است با استفاده از Gemini 2.5 Pro در Google Cloud اجرا شود. ایجنت تجزیه و تحلیل داده‌ها ممکن است توسط یک مدل وزن باز تامین شود و در سرورهای خود شرکت اجرا شود، جایی که می‌تواند به داده‌های اختصاصی دسترسی داشته باشد. ایجنت‌های گزارش و توسعه‌دهنده وب ممکن است از Claude 3.7 Sonnet استفاده کنند و در Amazon Bedrock اجرا شوند.

به لطف پروتکلی مانند A2A، این ایجنت‌های مختلف می‌توانند به طور شفاف در سراسر ارائه‌دهندگان مختلف با یکدیگر کار کنند.