OpenAI از API پاسخهای جدید، SDK عوامل و ابزارهای مشاهدهپذیری برای رفع چالشهایی که ایجاد عوامل آماده تولید ایجاد میکند، مانند ساخت ارکستراسیون سفارشی و رسیدگی به تکرار سریع در سراسر وظایف پیچیده و چند مرحلهای، خبر داده است.
OpenAI میگوید که عوامل به زودی جزء لاینفک نیروی کار خواهند شد و با انجام وظایف پیچیده با استفاده از قابلیتهای پیشرفتهای مانند استدلال و تعاملات چندوجهی، بهرهوری را در صنایع مختلف افزایش میدهند. ابزارهای جدیدی که توسط OpenAI راهاندازی شدهاند، هدفشان تسهیل ساخت گردشهای کاری عاملمحور با استفاده از پلتفرم OpenAI برای توسعهدهندگان است.
API پاسخها، تکمیلهای چت را با قابلیتهای دستیار ترکیب میکند و باید بر API تکمیلهای چت و API دستیاران برای پروژههای جدید اولویت داشته باشد.
ما معتقدیم که API پاسخها یک پایه انعطافپذیرتر برای توسعهدهندگانی که برنامههای عاملمحور میسازند، فراهم میکند. با یک تماس API پاسخها، توسعهدهندگان قادر خواهند بود وظایف پیچیدهتر را با استفاده از ابزارها و مدلهای متعدد حل کنند.
API جدید همچنین پشتیبانی داخلی از ابزارهای خارجی از جمله جستجوی وب، جستجوی فایل محلی و کنترل کامپیوتر با استفاده از ماوس و صفحه کلید را فراهم میکند. علاوه بر این، چندین بهبود را ارائه میدهد که استفاده از آن را بر اساس بازخورد توسعهدهندگان در مورد مدلهای قبلی، سادهتر میکند، از جمله یک طراحی یکپارچه، چندریختی سادهتر، پخش جریانی بهبود یافته و چندین کمککننده SDK.
برای جستجوی وب، API پاسخها از همان مدلهایی استفاده میکند که برای جستجوی ChatGPT، پیشنمایش جستجوی GPT-4o و پیشنمایش جستجوی GPT-4o mini استفاده میشوند. این مدلها در معیار SimpleQA امتیاز 90٪ و 88٪ را کسب کردند که به طور قابل توجهی بهتر از عملکرد مدلهای GPT "ساده" (شامل بین 15٪ و 63٪) است. با این حال، ابزار استفاده از کامپیوتر در معیار OSWorld در 38.1٪ قرار دارد، که نشان میدهد این مدل هنوز برای خودکارسازی وظایف در سیستم عاملها بسیار قابل اعتماد نیست.
در حالی که هر دو API تکمیلهای چت و API دستیاران در حال حاضر در دسترس خواهند بود و OpenAI متعهد به بهبود اولی با مدلها و ویژگیهای جدید است، این شرکت قبلاً اعلام کرده است که API دستیاران در سال آینده منسوخ خواهد شد.
OpenAI همراه با API پاسخها، SDK عوامل جدید را نیز با هدف سازماندهی گردشهای کاری عاملمحور با تعریف عوامل متمایز، مدیریت انتقال کنترل بین آنها (تحویل)، تعریف بررسیهای ایمنی برای ورودی و خروجی برای جلوگیری از رفتار نامربوط، مضر یا نامطلوب (حفاظتها) و تجسم ردیابیها برای مشاهده عوامل، راهاندازی کرده است.
SDK عوامل برای کاربردهای مختلف دنیای واقعی، از جمله اتوماسیون پشتیبانی مشتری، تحقیقات چند مرحلهای، تولید محتوا، بررسی کد و جستجوی فروش مناسب است.
SDK عوامل از تمام مدلهای فعلی OpenAI، از جمله o1، o3-mini، GPT-4.5، GPT-4o و GPT-4o-mini پشتیبانی میکند. همچنین به توسعهدهندگان اجازه میدهد تا عوامل خود را با دانش خارجی و دائمی که از طریق فروشگاههای برداری و API جاسازی ارائه میشود، تقویت کنند. SDK عوامل با تکیه بر API پاسخها، از همان ابزارهای خارجی برای جستجوی وب، فایلهای محلی یا کنترل یک کامپیوتر پشتیبانی میکند.
SDK عوامل جایگزین عامل ارکستراسیون آزمایشی Swarm خود میشود و با هر API به سبک تکمیلهای چت، از جمله API پاسخها و APIهای شخص ثالث سازگار است.
در میان واکنشهای جامعه، برخی از خوانندگان Hacker News (HN) این احساس را ابراز کردند که حرکت OpenAI از API تکمیلهای چت به دلایل "غیر فنی" دیکته شده است و خطر قفل شدن در پلتفرم آنها را به همراه دارد. در همین راستا، برخی از خوانندگان پیشنهاد میکنند که حذف تدریجی API Assistant نشان میدهد که یک رویکرد خوب این است که کد را برای API پاسخها بازنویسی نکنید، بلکه یک wrapper ایجاد کنید تا در صورت نیاز بتوانید LLM زیربنایی را جایگزین کنید.
از سوی دیگر، چندین خواننده HN اشاره کردند که اتخاذ SDK عوامل یا هر میانافزار عامل دیگر به این معنی است که شما اساساً مدیریت وضعیت و منطق تجاری خود را به یک شخص ثالث "برونسپاری" میکنید در حالی که ممکن است ترجیح دهید کامپوننت LLM را تا حد امکان کوچک نگه دارید و منطق خود را در اطراف آن بسازید.