صنعت هوش مصنوعی در تلاش است تا «عاملها» - قطعات نرمافزاری مبتنی بر هوش مصنوعی که میتوانند اقدامات چند مرحلهای را از طرف شما انجام دهند - را به واقعیت تبدیل کند. چندین شرکت فناوری، از جمله گوگل، اخیراً بر ویژگیهای عاملمحور تأکید کردهاند، و در ژانویه، سام آلتمن، مدیرعامل OpenAI، نوشت که سال 2025 سالی خواهد بود که عوامل هوش مصنوعی «به نیروی کار میپیوندند».
OpenAI در تلاش است تا این وعده را به واقعیت تبدیل کند. روز سهشنبه، OpenAI از یک "API پاسخها" جدید رونمایی کرد که برای کمک به توسعهدهندگان نرمافزار در ایجاد عوامل هوش مصنوعی طراحی شده است که میتوانند وظایف را به طور مستقل با استفاده از مدلهای هوش مصنوعی این شرکت انجام دهند. API پاسخها در نهایت جایگزین API فعلی دستیارها خواهد شد که OpenAI قصد دارد در نیمه اول سال 2026 آن را بازنشسته کند.
با ارائه جدید، کاربران میتوانند عوامل هوش مصنوعی سفارشی ایجاد کنند که فایلهای شرکت را با یک ابزار جستجوی فایل که به سرعت پایگاههای داده شرکت را بررسی میکند (با این وعده OpenAI که مدلهای خود را بر روی این فایلها آموزش نمیدهد) اسکن کرده و در وبسایتها پیمایش کنند - مشابه عملکردهایی که از طریق عامل اپراتور OpenAI در دسترس هستند، که توسعهدهندگان مدل عامل استفاده از کامپیوتر (CUA) زیربنایی آن نیز میتوانند به آن دسترسی داشته باشند تا اتوماسیون وظایفی مانند ورود دادهها و سایر عملیات را فعال کنند.
با این حال، OpenAI اذعان میکند که مدل CUA آن هنوز برای خودکارسازی وظایف در سیستمعاملها قابل اعتماد نیست و میتواند اشتباهات ناخواسته انجام دهد. این شرکت API جدید را به عنوان یک تکرار اولیه توصیف میکند که به بهبود آن در طول زمان ادامه خواهد داد.
توسعهدهندگانی که از API پاسخها استفاده میکنند میتوانند به همان مدلهایی دسترسی داشته باشند که ChatGPT Search را تقویت میکنند: جستجوی GPT-4o و جستجوی GPT-4o mini. این مدلها میتوانند در وب جستجو کنند تا به سؤالات پاسخ دهند و منابع را در پاسخهای خود ذکر کنند.
این قابل توجه است زیرا OpenAI میگوید توانایی جستجوی وب اضافهشده دقت واقعی مدلهای هوش مصنوعی آن را به طور چشمگیری بهبود میبخشد. در معیار SimpleQA OpenAI، که هدف آن اندازهگیری نرخ ساختگی است، جستجوی GPT-4o امتیاز 90 درصد و جستجوی GPT-4o mini امتیاز 88 درصد را به دست آورد - که هر دو به طور قابل توجهی از مدل بزرگتر GPT-4.5 بدون جستجو که امتیاز 63 درصد را به دست آورد، بهتر عمل کردند.
علیرغم این پیشرفتها، این فناوری هنوز محدودیتهای قابل توجهی دارد. جدا از مسائل مربوط به پیمایش صحیح وبسایتها توسط CUA، قابلیت جستجوی بهبودیافته به طور کامل مشکل ساختگیهای هوش مصنوعی را حل نمیکند، به طوری که جستجوی GPT-4o همچنان 10 درصد مواقع اشتباهات واقعی مرتکب میشود.
در کنار API پاسخها، OpenAI کیت توسعه نرمافزار عاملهای متنباز را منتشر کرد و ابزارهای رایگانی را در اختیار توسعهدهندگان قرار داد تا مدلها را با سیستمهای داخلی ادغام کنند، محافظتها را پیادهسازی کنند و فعالیتهای عامل را نظارت کنند. این مجموعه ابزار از انتشار قبلی OpenAI از Swarm، یک چارچوب برای سازماندهی چندین عامل، پیروی میکند.
اینها هنوز روزهای اولیه در زمینه عامل هوش مصنوعی هستند و احتمالاً همه چیز به سرعت بهبود خواهد یافت. با این حال، در حال حاضر، جنبش عامل هوش مصنوعی همچنان در برابر ادعاهای غیرواقعی آسیبپذیر است، همانطور که اوایل این هفته زمانی که کاربران کشف کردند که پلتفرم عامل Manus AI شرکت نوپای چینی Butterfly Effect نتوانست بسیاری از وعدههای خود را عملی کند، که شکاف پایدار بین ادعاهای تبلیغاتی و عملکرد عملی در این دسته فناوری نوظهور را برجسته میکند.