OpenAI در حال ارائه مجموعه جدیدی از APIها و ابزارها استکه برای کمک به توسعهدهندگان و شرکتها طراحی شده تا عاملهای مبتنی بر هوش مصنوعی را بهطور کارآمدتری بر روی همان فناوریای بسازند که عاملهای هوش مصنوعی شخص اول خود را تقویت میکند، ابزارDeep Research(که بهطور مستقل اینترنت را جستجو میکند تا گزارشهای غنی، سازمانیافته و مستند ایجاد کند) وOperator(ابزار آن برای کنترل خودکار نشانگر مرورگر وب بر اساس دستورالعملهای متنی کاربر و انجام اقداماتی مانند یافتن بلیطهای ورزشی یا رزرو)
اکنون، با دسترسی به بلوکهای سازنده پشت این عاملهای قدرتمند شخص اول OpenAI، توسعهدهندگان میتوانند رقبای شخص ثالث خود یا محصولات و خدمات تخصصیتر را متناسب با مورد استفاده و مخاطبان خود بسازند.
پیشرفتهای اخیر OpenAI در استدلال، پردازش چندوجهی و مکانیزمهای ایمنی، زمینهساز این قابلیتها شده است، بهویژه خانواده مدلهای استدلالی "o" آن (o1وo3).
الیویه گودمان، رئیس بخش محصول پلتفرم OpenAI، در یک تماس ویدیویی با VentureBeat گفت: «اهمیت حیاتی مدلهای استدلالی برای فعالسازی عاملهای هوش مصنوعی را نمیتوان دستکم گرفت. یکی از بزرگترین محدودیتها قبل از این، رسیدگی به وظایف طولانیمدت مانند برنامهریزی بود.»
اما این شرکت میگوید که توسعهدهندگان هنوز ابزارهای لازم برای ساخت آسان آنها را در برنامههای کاربردی آماده تولید برای شرکتها و مشتریانشان نداشتهاند - تا به امروز.
برای رفع این موانع، OpenAI چندین پیشنهاد جدید را معرفی میکند: Responses API، ابزارهای داخلی برای جستجوی وب و فایل، ابزار استفاده از رایانه و Agents SDK متنباز.
هدف این ابزارها سادهسازی توسعه عاملهای هوش مصنوعی با کاهش نیاز به مهندسی سریع گسترده و منطق هماهنگی سفارشی است. آنها همچنین باید پیشنهاد جذابی برای ادامه ساخت بر روی پلتفرم OpenAI حتی در مواجهه با افزایش رقابت از سوی بازیگران چینی مانندManus،Qwen علیبابا،DeepSeekو رقبای داخلی مانندAnthropicوGoogleتبدیل شوند.
در حالی که این بازیگران دیگر ابزارها یا محصولات توسعهدهنده را ارائه میدهند، تکامل مداوم پلتفرم توسعهدهنده OpenAI آن را به پیشنهادی سخت برای شکست دادن به عنوان یک "فروشگاه یکجا" برای کسانی که به دنبال استفاده از آخرین پیشرفتهای هوش مصنوعی به روشی تمیز، آسان برای استفاده، سریع و مقرونبهصرفه هستند، تبدیل میکند.
Agents SDK ابزارهای متنباز برای ساخت عاملها حتی بر روی مدلهای غیر OpenAI فراهم میکند
در اقدامی که مطمئناً وبلاگستان هوش مصنوعی و فضای رسانههای اجتماعی را به تلاطم میاندازد، OpenAI با انتشار Agents SDK، جعبهابزاری که برای کمک به توسعهدهندگان در مدیریت، هماهنگی و بهینهسازی گردشهای کاری عاملها طراحی شده است، بهطور گسترده به متنباز بازمیگردد - حتی ساخت عاملهایی که توسط مدلهای دیگر، غیر OpenAI مانند مدلهای رقبایی مانند Anthropic و Google یا مدلهای متنباز از DeepSeek، Qwen، Mistral و خانواده Llama متا، پشتیبانی میشوند.
گودمان گفت: «Agent SDK متنباز است و به شرکتها اجازه میدهد مدلهای مختلف را با هم ترکیب کنند. ما نمیخواهیم هیچکس را مجبور کنیم که فقط از مدلهای OpenAI استفاده کند.»
SDK ویژگیهای کلیدی مانند:
•عاملهای قابل تنظیم- مدلهای هوش مصنوعی با دستورالعملهای از پیش تعریفشده و دسترسی به ابزار.
•واگذاریهای هوشمند- مکانیزمهایی برای انتقال وظایف بین عاملها بر اساس زمینه.
•حصارکشیهای داخلی- اقدامات ایمنی برای اعتبارسنجی ورودی و تعدیل محتوا.
•ردیابی و قابلیت مشاهده- ابزارهایی برای اشکالزدایی و بهینهسازی عملکرد عامل.
هاندا گفت: «با Agents SDK، توسعهدهندگان میتوانند دقیقاً ردیابی کنند که یک عامل چه کاری انجام میدهد - چه وظایفی ایجاد میکند، چه دادههایی جمعآوری میکند و چگونه پاسخها را تولید میکند.»
Responses API جدید چه چیزی ارائه میدهد
در مرکز این بهروزرسانی Responses API قرار دارد که ویژگیهای Chat Completions API OpenAI را با قابلیت استفاده از ابزار Assistants API ترکیب میکند.
این ادغام به توسعهدهندگان اجازه میدهد تا از چندین ابزار داخلی در یک فراخوانی API واحد استفاده کنند و ساخت برنامههای کاربردی که نیاز به تعاملات پیچیده و چندمرحلهای دارند را آسانتر میکند.
Responses API در ابتدا از سه ابزار داخلی پشتیبانی میکند:
•جستجوی وب- با دریافت اطلاعات از وب، پاسخهای بلادرنگ و مستند ارائه میدهد.
•جستجوی فایل- اطلاعات مرتبط را از مخازن بزرگ اسناد با استفاده از فیلتر کردن فراداده و پردازش پرسوجوی بهینهسازیشده بازیابی میکند.
•ابزار استفاده از رایانه- عاملهای هوش مصنوعی را قادر میسازد تا اقداماتی را روی یک رایانه انجام دهند، مانند مرور، ورود دادهها و پیمایش رابطهای نرمافزاری.
نیکونج هاندا، مدیر محصول تیم API OpenAI، در همان تماس ویدیویی با VentureBeat گفت: «با Responses API، توسعهدهندگان دید بهتری نسبت به کاری که مدل انجام میدهد به دست میآورند - چه ابزارهایی را فراخوانی میکند، چرا آنها را فراخوانی میکند و چه تصمیماتی قبل و بعد از آن تماسها میگیرد.»
OpenAI با این قابلیتها، Responses API را به عنوان پایهای برای برنامههای کاربردی عاملمحور در نظر میگیرد و نیاز به ادغامهای خارجی متعدد را از بین میبرد. API از امروز برای همه توسعهدهندگان در دسترس است و استفاده از آن با نرخ استاندارد توکن و ابزار OpenAI صورتحساب میشود.
علاوه بر این، OpenAI خاطرنشان میکند که در حالی که Chat Completions API به دریافت بهروزرسانیها ادامه خواهد داد، Responses API به عنوان مجموعه فوقانی آن در نظر گرفته میشود. توسعهدهندگانی که به ابزارهای داخلی یا تعاملات مدل چندمرحلهای نیاز دارند، باید از Responses API برای ادغامهای جدید استفاده کنند.
OpenAI همچنین ابزارهای جستجوی وب، جستجوی فایل و استفاده از رایانه خود را مستقیماً از طریق Responses API در دسترس قرار میدهد. این ابزارها عاملهای هوش مصنوعی را قادر میسازند تا به اطلاعات دنیای واقعی دسترسی داشته باشند، زمینه را از اسناد بازیابی کنند و به طور موثرتری با محیطهای دیجیتال تعامل داشته باشند.
جستجوی وب اطلاعات بلادرنگ را با استناد به توسعهدهندگان ارائه میدهد
ابزار جستجوی وب به توسعهدهندگان اجازه میدهد تا قابلیتهای جستجوی بلادرنگ را در برنامههای کاربردی خود ادغام کنند و آن را برای دستیاران تحقیقاتی، راهنمای خرید و ابزارهای جمعآوری محتوا مفید میکند. این ابزار منابعی را برای پاسخهای خود ارائه میدهد و اطمینان میدهد که کاربران میتوانند صحت اطلاعات را تأیید کنند.
هاندا گفت: «اولین چیزی که ما راهاندازی میکنیم ابزارهای داخلی مانند جستجوی وب است که به مدلها اجازه میدهد به اطلاعات بلادرنگ دسترسی داشته باشند. این همان ابزاری است که جستجوی ChatGPT را نیرو میدهد و اکنون ما آن را به API میآوریم.»
OpenAI همچنین تأیید کرد که نتایج جستجوی وب در API شامل استنادهای واضح خواهد بود و به کاربران اجازه میدهد تا به منابع اصلی کلیک کنند. توسعهدهندگان میتوانند جستجوی وب را به عنوان بخشی از یک سیستم بازیابی گستردهتر که شامل منابع داده اختصاصی است، پیادهسازی کنند.
جستجوی فایل: بازیابی هوشمند سند در ابرهای خصوصی
با ابزار جستجوی فایل، عاملهای هوش مصنوعی میتوانند به سرعت اطلاعات مرتبط را از مجموعههای بزرگ اسناد بازیابی کنند. این ابزار از چندین فرمت فایل پشتیبانی میکند و شامل ویژگیهایی مانند بهینهسازی پرسوجو، فیلتر کردن فراداده و رتبهبندی سفارشی برای نتایج دقیقتر است.
هاندا توضیح داد: «سومین ابزاری که ما راهاندازی میکنیم جستجوی فایل است که برای توسعهدهندگان آسان میکند تا تمام دادههای خود را بگیرند، آن را در سیستم ما ذخیره کنند و اطلاعات صحیح را با دقت بالا استخراج کنند.»
قیمت ابزار جستجوی فایل 2.50 دلار برای هر هزار پرسوجو است، با هزینههای ذخیرهسازی 0.10 دلار در هر گیگابایت در روز (اولین گیگابایت رایگان است).
توسعهدهندگان اکنون میتوانند به Computer Use، فناوریای که Operator OpenAI را نیرو میدهد، دسترسی داشته باشند
ابزار استفاده از رایانه قابلیتهای عامل را فراتر از وظایف ساده مبتنی بر متن گسترش میدهد و به هوش مصنوعی اجازه میدهد با رابطهای رایانه تعامل داشته باشد.
این ابزار که توسط مدل عامل استفاده از رایانه (CUA) OpenAI نیرو میگیرد، اقدامات تولید شده توسط هوش مصنوعی را به فرمانهای اجرایی ترجمه میکند و اتوماسیون وظایفی مانند ورود دادهها و پیمایش وب را امکانپذیر میکند.
هاندا خاطرنشان کرد: «ما همچنین در حال راهاندازی یک ابزار استفاده از رایانه هستیم که به مدلها اجازه میدهد در صورت عدم وجود API موجود برای یک کار، با رابطهای کاربری گرافیکی تعامل داشته باشند.»
ابزار استفاده از رایانه در حال حاضر به عنوان پیشنمایش تحقیقاتی برای توسعهدهندگان منتخب در سطوح استفاده 3-5 در دسترس است. قیمتگذاری روی 3 دلار برای هر میلیون توکن ورودی و 12 دلار برای هر میلیون توکن خروجی تنظیم شده است.
این برای رهبران شرکت چه معنایی دارد
برای رهبران تیم فناوری اطلاعات، مدیران ارشد فناوری و مدیران میانی که به دنبال بهینهسازی گردشهای کاری هستند، ابزارهای جدید OpenAI مسیری روشن به سوی خودکارسازی و مقیاسبندی فرآیندهای مبتنی بر هوش مصنوعی بدون نیاز به توسعه سفارشی گسترده ارائه میدهند.
قابلیتهای داخلی جستجوی وب و جستجوی فایل به شرکتها اجازه میدهد تا به سرعت بازیابی اطلاعات مبتنی بر هوش مصنوعی را در سیستمهای موجود خود ادغام کنند، در حالی که ابزار استفاده از رایانه تعاملات خودکار با برنامههای کاربردی قدیمی که فاقد دسترسی API هستند را امکانپذیر میکند.
Agents SDK متنباز بیشتر سازمانها را قادر میسازد تا گردشهای کاری مبتنی بر هوش مصنوعی را در بین تیمها هماهنگ کنند و استقرار عاملهایی که کارایی را در زمینههایی مانند پشتیبانی مشتری، پردازش اسناد و تحقیقات بازار بهبود میبخشند را آسانتر میکند.
با امنیت شرکت و قابلیت مشاهده داخلی در این ابزارها، تصمیمگیرندگان میتوانند راهحلهای هوش مصنوعی را با شفافیت و کنترل بیشتری اتخاذ کنند و از انطباق و نظارت بر عملکرد در مقیاس اطمینان حاصل کنند.
بعدش چی؟
OpenAI این نسخههای جدید را اولین قدم در ساخت یک پلتفرم جامع برای عاملهای هوش مصنوعی میداند. این شرکت قصد دارد در ماههای آینده ابزارها و ادغامهای بیشتری را عرضه کند تا به توسعهدهندگان کمک کند برنامههای کاربردی عاملمحور را به طور موثرتری مستقر، ارزیابی و مقیاسبندی کنند.
گودمان گفت: «ما فکر میکنیم ماههای آینده برای استقرار بیشتر و بیشتر عاملها در مقیاس حیاتی خواهد بود. ما قبلاً این کار را با عاملهای شخص اول مانند Deep Research انجام دادهایم، اما OpenAI قصد ندارد هر عاملی را بسازد - به همین دلیل است که ما یک پلتفرم توسعهدهنده داریم.»
OpenAI همچنین اظهار داشت که به بهبود ویژگیهای ایمنی برای برنامههای کاربردی عاملمحور، از جمله محافظت در برابر تزریق سریع و دسترسی غیرمجاز به دادهها، ادامه خواهد داد.
توسعهدهندگان علاقهمند به ساخت با ابزارهای جدید میتوانند مستندات OpenAI و زمین بازی API را برای شروع کار امروز بررسی کنند.