تصویر ساخته‌شده توسط VentureBeat با استفاده از OpenAI ChatGPT
تصویر ساخته‌شده توسط VentureBeat با استفاده از OpenAI ChatGPT

OpenAI از Responses API و Agents SDK متن‌باز رونمایی کرد

OpenAI در حال ارائه مجموعه جدیدی از APIها و ابزارها استکه برای کمک به توسعه‌دهندگان و شرکت‌ها طراحی شده تا عامل‌های مبتنی بر هوش مصنوعی را به‌طور کارآمدتری بر روی همان فناوری‌ای بسازند که عامل‌های هوش مصنوعی شخص اول خود را تقویت می‌کند، ابزارDeep Research(که به‌طور مستقل اینترنت را جستجو می‌کند تا گزارش‌های غنی، سازمان‌یافته و مستند ایجاد کند) وOperator(ابزار آن برای کنترل خودکار نشانگر مرورگر وب بر اساس دستورالعمل‌های متنی کاربر و انجام اقداماتی مانند یافتن بلیط‌های ورزشی یا رزرو)

اکنون، با دسترسی به بلوک‌های سازنده پشت این عامل‌های قدرتمند شخص اول OpenAI، توسعه‌دهندگان می‌توانند رقبای شخص ثالث خود یا محصولات و خدمات تخصصی‌تر را متناسب با مورد استفاده و مخاطبان خود بسازند.

پیشرفت‌های اخیر OpenAI در استدلال، پردازش چندوجهی و مکانیزم‌های ایمنی، زمینه‌ساز این قابلیت‌ها شده است، به‌ویژه خانواده مدل‌های استدلالی "o" آن (o1وo3).

الیویه گودمان، رئیس بخش محصول پلتفرم OpenAI، در یک تماس ویدیویی با VentureBeat گفت: «اهمیت حیاتی مدل‌های استدلالی برای فعال‌سازی عامل‌های هوش مصنوعی را نمی‌توان دست‌کم گرفت. یکی از بزرگ‌ترین محدودیت‌ها قبل از این، رسیدگی به وظایف طولانی‌مدت مانند برنامه‌ریزی بود.»

اما این شرکت می‌گوید که توسعه‌دهندگان هنوز ابزارهای لازم برای ساخت آسان آن‌ها را در برنامه‌های کاربردی آماده تولید برای شرکت‌ها و مشتریانشان نداشته‌اند - تا به امروز.

برای رفع این موانع، OpenAI چندین پیشنهاد جدید را معرفی می‌کند: Responses API، ابزارهای داخلی برای جستجوی وب و فایل، ابزار استفاده از رایانه و Agents SDK متن‌باز.

هدف این ابزارها ساده‌سازی توسعه عامل‌های هوش مصنوعی با کاهش نیاز به مهندسی سریع گسترده و منطق هماهنگی سفارشی است. آن‌ها همچنین باید پیشنهاد جذابی برای ادامه ساخت بر روی پلتفرم OpenAI حتی در مواجهه با افزایش رقابت از سوی بازیگران چینی مانندManus،Qwen علی‌بابا،DeepSeekو رقبای داخلی مانندAnthropicوGoogleتبدیل شوند.

در حالی که این بازیگران دیگر ابزارها یا محصولات توسعه‌دهنده را ارائه می‌دهند، تکامل مداوم پلتفرم توسعه‌دهنده OpenAI آن را به پیشنهادی سخت برای شکست دادن به عنوان یک "فروشگاه یک‌جا" برای کسانی که به دنبال استفاده از آخرین پیشرفت‌های هوش مصنوعی به روشی تمیز، آسان برای استفاده، سریع و مقرون‌به‌صرفه هستند، تبدیل می‌کند.

Agents SDK ابزارهای متن‌باز برای ساخت عامل‌ها حتی بر روی مدل‌های غیر OpenAI فراهم می‌کند

در اقدامی که مطمئناً وبلاگستان هوش مصنوعی و فضای رسانه‌های اجتماعی را به تلاطم می‌اندازد، OpenAI با انتشار Agents SDK، جعبه‌ابزاری که برای کمک به توسعه‌دهندگان در مدیریت، هماهنگی و بهینه‌سازی گردش‌های کاری عامل‌ها طراحی شده است، به‌طور گسترده به متن‌باز بازمی‌گردد - حتی ساخت عامل‌هایی که توسط مدل‌های دیگر، غیر OpenAI مانند مدل‌های رقبایی مانند Anthropic و Google یا مدل‌های متن‌باز از DeepSeek، Qwen، Mistral و خانواده Llama متا، پشتیبانی می‌شوند.

گودمان گفت: «Agent SDK متن‌باز است و به شرکت‌ها اجازه می‌دهد مدل‌های مختلف را با هم ترکیب کنند. ما نمی‌خواهیم هیچ‌کس را مجبور کنیم که فقط از مدل‌های OpenAI استفاده کند.»

SDK ویژگی‌های کلیدی مانند:

عامل‌های قابل تنظیم- مدل‌های هوش مصنوعی با دستورالعمل‌های از پیش تعریف‌شده و دسترسی به ابزار.

واگذاری‌های هوشمند- مکانیزم‌هایی برای انتقال وظایف بین عامل‌ها بر اساس زمینه.

حصارکشی‌های داخلی- اقدامات ایمنی برای اعتبارسنجی ورودی و تعدیل محتوا.

ردیابی و قابلیت مشاهده- ابزارهایی برای اشکال‌زدایی و بهینه‌سازی عملکرد عامل.

هاندا گفت: «با Agents SDK، توسعه‌دهندگان می‌توانند دقیقاً ردیابی کنند که یک عامل چه کاری انجام می‌دهد - چه وظایفی ایجاد می‌کند، چه داده‌هایی جمع‌آوری می‌کند و چگونه پاسخ‌ها را تولید می‌کند.»

Responses API جدید چه چیزی ارائه می‌دهد

در مرکز این به‌روزرسانی Responses API قرار دارد که ویژگی‌های Chat Completions API OpenAI را با قابلیت استفاده از ابزار Assistants API ترکیب می‌کند.

این ادغام به توسعه‌دهندگان اجازه می‌دهد تا از چندین ابزار داخلی در یک فراخوانی API واحد استفاده کنند و ساخت برنامه‌های کاربردی که نیاز به تعاملات پیچیده و چندمرحله‌ای دارند را آسان‌تر می‌کند.

Responses API در ابتدا از سه ابزار داخلی پشتیبانی می‌کند:

جستجوی وب- با دریافت اطلاعات از وب، پاسخ‌های بلادرنگ و مستند ارائه می‌دهد.

جستجوی فایل- اطلاعات مرتبط را از مخازن بزرگ اسناد با استفاده از فیلتر کردن فراداده و پردازش پرس‌وجوی بهینه‌سازی‌شده بازیابی می‌کند.

ابزار استفاده از رایانه- عامل‌های هوش مصنوعی را قادر می‌سازد تا اقداماتی را روی یک رایانه انجام دهند، مانند مرور، ورود داده‌ها و پیمایش رابط‌های نرم‌افزاری.

نیکونج هاندا، مدیر محصول تیم API OpenAI، در همان تماس ویدیویی با VentureBeat گفت: «با Responses API، توسعه‌دهندگان دید بهتری نسبت به کاری که مدل انجام می‌دهد به دست می‌آورند - چه ابزارهایی را فراخوانی می‌کند، چرا آن‌ها را فراخوانی می‌کند و چه تصمیماتی قبل و بعد از آن تماس‌ها می‌گیرد.»

OpenAI با این قابلیت‌ها، Responses API را به عنوان پایه‌ای برای برنامه‌های کاربردی عامل‌محور در نظر می‌گیرد و نیاز به ادغام‌های خارجی متعدد را از بین می‌برد. API از امروز برای همه توسعه‌دهندگان در دسترس است و استفاده از آن با نرخ استاندارد توکن و ابزار OpenAI صورت‌حساب می‌شود.

علاوه بر این، OpenAI خاطرنشان می‌کند که در حالی که Chat Completions API به دریافت به‌روزرسانی‌ها ادامه خواهد داد، Responses API به عنوان مجموعه فوقانی آن در نظر گرفته می‌شود. توسعه‌دهندگانی که به ابزارهای داخلی یا تعاملات مدل چندمرحله‌ای نیاز دارند، باید از Responses API برای ادغام‌های جدید استفاده کنند.

OpenAI همچنین ابزارهای جستجوی وب، جستجوی فایل و استفاده از رایانه خود را مستقیماً از طریق Responses API در دسترس قرار می‌دهد. این ابزارها عامل‌های هوش مصنوعی را قادر می‌سازند تا به اطلاعات دنیای واقعی دسترسی داشته باشند، زمینه را از اسناد بازیابی کنند و به طور موثرتری با محیط‌های دیجیتال تعامل داشته باشند.

جستجوی وب اطلاعات بلادرنگ را با استناد به توسعه‌دهندگان ارائه می‌دهد

ابزار جستجوی وب به توسعه‌دهندگان اجازه می‌دهد تا قابلیت‌های جستجوی بلادرنگ را در برنامه‌های کاربردی خود ادغام کنند و آن را برای دستیاران تحقیقاتی، راهنمای خرید و ابزارهای جمع‌آوری محتوا مفید می‌کند. این ابزار منابعی را برای پاسخ‌های خود ارائه می‌دهد و اطمینان می‌دهد که کاربران می‌توانند صحت اطلاعات را تأیید کنند.

هاندا گفت: «اولین چیزی که ما راه‌اندازی می‌کنیم ابزارهای داخلی مانند جستجوی وب است که به مدل‌ها اجازه می‌دهد به اطلاعات بلادرنگ دسترسی داشته باشند. این همان ابزاری است که جستجوی ChatGPT را نیرو می‌دهد و اکنون ما آن را به API می‌آوریم.»

OpenAI همچنین تأیید کرد که نتایج جستجوی وب در API شامل استنادهای واضح خواهد بود و به کاربران اجازه می‌دهد تا به منابع اصلی کلیک کنند. توسعه‌دهندگان می‌توانند جستجوی وب را به عنوان بخشی از یک سیستم بازیابی گسترده‌تر که شامل منابع داده اختصاصی است، پیاده‌سازی کنند.

جستجوی فایل: بازیابی هوشمند سند در ابرهای خصوصی

با ابزار جستجوی فایل، عامل‌های هوش مصنوعی می‌توانند به سرعت اطلاعات مرتبط را از مجموعه‌های بزرگ اسناد بازیابی کنند. این ابزار از چندین فرمت فایل پشتیبانی می‌کند و شامل ویژگی‌هایی مانند بهینه‌سازی پرس‌وجو، فیلتر کردن فراداده و رتبه‌بندی سفارشی برای نتایج دقیق‌تر است.

هاندا توضیح داد: «سومین ابزاری که ما راه‌اندازی می‌کنیم جستجوی فایل است که برای توسعه‌دهندگان آسان می‌کند تا تمام داده‌های خود را بگیرند، آن را در سیستم ما ذخیره کنند و اطلاعات صحیح را با دقت بالا استخراج کنند.»

قیمت ابزار جستجوی فایل 2.50 دلار برای هر هزار پرس‌وجو است، با هزینه‌های ذخیره‌سازی 0.10 دلار در هر گیگابایت در روز (اولین گیگابایت رایگان است).

توسعه‌دهندگان اکنون می‌توانند به Computer Use، فناوری‌ای که Operator OpenAI را نیرو می‌دهد، دسترسی داشته باشند

ابزار استفاده از رایانه قابلیت‌های عامل را فراتر از وظایف ساده مبتنی بر متن گسترش می‌دهد و به هوش مصنوعی اجازه می‌دهد با رابط‌های رایانه تعامل داشته باشد.

این ابزار که توسط مدل عامل استفاده از رایانه (CUA) OpenAI نیرو می‌گیرد، اقدامات تولید شده توسط هوش مصنوعی را به فرمان‌های اجرایی ترجمه می‌کند و اتوماسیون وظایفی مانند ورود داده‌ها و پیمایش وب را امکان‌پذیر می‌کند.

هاندا خاطرنشان کرد: «ما همچنین در حال راه‌اندازی یک ابزار استفاده از رایانه هستیم که به مدل‌ها اجازه می‌دهد در صورت عدم وجود API موجود برای یک کار، با رابط‌های کاربری گرافیکی تعامل داشته باشند.»

ابزار استفاده از رایانه در حال حاضر به عنوان پیش‌نمایش تحقیقاتی برای توسعه‌دهندگان منتخب در سطوح استفاده 3-5 در دسترس است. قیمت‌گذاری روی 3 دلار برای هر میلیون توکن ورودی و 12 دلار برای هر میلیون توکن خروجی تنظیم شده است.

این برای رهبران شرکت چه معنایی دارد

برای رهبران تیم فناوری اطلاعات، مدیران ارشد فناوری و مدیران میانی که به دنبال بهینه‌سازی گردش‌های کاری هستند، ابزارهای جدید OpenAI مسیری روشن به سوی خودکارسازی و مقیاس‌بندی فرآیندهای مبتنی بر هوش مصنوعی بدون نیاز به توسعه سفارشی گسترده ارائه می‌دهند.

قابلیت‌های داخلی جستجوی وب و جستجوی فایل به شرکت‌ها اجازه می‌دهد تا به سرعت بازیابی اطلاعات مبتنی بر هوش مصنوعی را در سیستم‌های موجود خود ادغام کنند، در حالی که ابزار استفاده از رایانه تعاملات خودکار با برنامه‌های کاربردی قدیمی که فاقد دسترسی API هستند را امکان‌پذیر می‌کند.

Agents SDK متن‌باز بیشتر سازمان‌ها را قادر می‌سازد تا گردش‌های کاری مبتنی بر هوش مصنوعی را در بین تیم‌ها هماهنگ کنند و استقرار عامل‌هایی که کارایی را در زمینه‌هایی مانند پشتیبانی مشتری، پردازش اسناد و تحقیقات بازار بهبود می‌بخشند را آسان‌تر می‌کند.

با امنیت شرکت و قابلیت مشاهده داخلی در این ابزارها، تصمیم‌گیرندگان می‌توانند راه‌حل‌های هوش مصنوعی را با شفافیت و کنترل بیشتری اتخاذ کنند و از انطباق و نظارت بر عملکرد در مقیاس اطمینان حاصل کنند.

بعدش چی؟

OpenAI این نسخه‌های جدید را اولین قدم در ساخت یک پلتفرم جامع برای عامل‌های هوش مصنوعی می‌داند. این شرکت قصد دارد در ماه‌های آینده ابزارها و ادغام‌های بیشتری را عرضه کند تا به توسعه‌دهندگان کمک کند برنامه‌های کاربردی عامل‌محور را به طور موثرتری مستقر، ارزیابی و مقیاس‌بندی کنند.

گودمان گفت: «ما فکر می‌کنیم ماه‌های آینده برای استقرار بیشتر و بیشتر عامل‌ها در مقیاس حیاتی خواهد بود. ما قبلاً این کار را با عامل‌های شخص اول مانند Deep Research انجام داده‌ایم، اما OpenAI قصد ندارد هر عاملی را بسازد - به همین دلیل است که ما یک پلتفرم توسعه‌دهنده داریم.»

OpenAI همچنین اظهار داشت که به بهبود ویژگی‌های ایمنی برای برنامه‌های کاربردی عامل‌محور، از جمله محافظت در برابر تزریق سریع و دسترسی غیرمجاز به داده‌ها، ادامه خواهد داد.

توسعه‌دهندگان علاقه‌مند به ساخت با ابزارهای جدید می‌توانند مستندات OpenAI و زمین بازی API را برای شروع کار امروز بررسی کنند.