OpenAI اخیراً مجموعهای از ابزارهای توسعهدهنده جدید را با هدف تسهیل ایجاد عوامل هوش مصنوعی منتشر کرده است که میتوانند وظایف پیچیده را به طور خودکار انجام دهند. این بهروزرسانی که هفته گذشته اعلام شد، شامل Responses API، یک Agents SDK متنباز و ابزارهای داخلی برای جستجوی وب، جستجوی فایل و کنترل رایانه است؛ همگی برای سادهسازی نحوه تعامل سیستمهای هوش مصنوعی با اطلاعات و برنامههای کاربردی دنیای واقعی طراحی شدهاند.
OpenAI این عوامل را به عنوان "سیستمهایی که به طور مستقل وظایف را از طرف کاربران انجام میدهند" توصیف میکند، به این معنی که آنها میتوانند فرآیندهای چند مرحلهای - مانند تحقیق در مورد یک موضوع یا به روز رسانی یک پایگاه داده - را با حداقل راهنمایی انسانی انجام دهند. هدف این شرکت کاهش موانع برای توسعهدهندگان و مشاغل در جهت استقرار دستیارهای قدرتمند مبتنی بر هوش مصنوعی است، در نتیجه دسترسی به قابلیتهای پیشرفته هوش مصنوعی را گسترش میدهد.
Responses API: سادهسازی تعاملات عامل
در قلب اطلاعیه OpenAI، Responses API جدید قرار دارد که به عنوان یک رابط واحد برای ساخت عوامل هوش مصنوعی عمل میکند. این API تواناییهای مکالمهای Chat Completions API OpenAI را با قابلیت استفاده از ابزار API قبلی Assistants ترکیب میکند. به عبارت عملی، این بدان معناست که یک فراخوانی API واحد اکنون میتواند وظایف پیچیده و چند مرحلهای را که ممکن است شامل فراخوانی ابزارهای مختلف یا منابع دانش باشد، انجام دهد.
OpenAI میگوید Responses API برای سادهسازی توسعه عامل با کاهش نیاز به کد سفارشی و دستکاری سریع ساخته شده است. این شرکت در پست وبلاگ اعلامیه خود توضیح داد: "Responses API برای توسعهدهندگانی طراحی شده است که میخواهند به راحتی مدلهای OpenAI و ابزارهای داخلی را در برنامههای خود ترکیب کنند، بدون پیچیدگی ادغام APIهای متعدد یا فروشندگان خارجی." پیش از این، توسعهدهندگان اغلب مجبور بودند چندین فراخوانی API را سازماندهی کرده و سریعهای دقیقی را برای وادار کردن یک عامل هوش مصنوعی به انجام کاری مفید ایجاد کنند، که این کار چالشبرانگیز و زمانبر بود. با API جدید، یک عامل میتواند، به عنوان مثال، با یک کاربر مکالمه کند، اطلاعات را از طریق جستجوی وب جستجو کند، سپس یک خلاصه بنویسد - همه در یک گردش کار.
شایان ذکر است، Responses API برای همه توسعهدهندگان بدون هیچ هزینه اضافی فراتر از هزینههای استاندارد استفاده در دسترس است. همچنین با نسخههای قبلی سازگار است: OpenAI تأیید کرده است که به پشتیبانی از Chat Completions API محبوب خود برای موارد استفاده ساده ادامه خواهد داد، در حالی که Assistants API قدیمی تا اواسط سال 2026 به تدریج حذف خواهد شد زیرا ویژگیهای آن در Responses API گنجانده شده است.
Agents SDK متنباز، سازماندهی گردش کار را ساده میکند
این عرضه همچنین شامل Agents SDK، یک جعبه ابزار برای مدیریت گردش کار یک یا حتی چند عامل هوش مصنوعی در تعامل است. در یک اقدام قابل توجه، OpenAI این SDK را به صورت متنباز درآورده است و به توسعهدهندگان و شرکتها اجازه میدهد تا کد را بازرسی کنند و حتی مدلهای غیر OpenAI را در سیستمهای عامل خود ادغام کنند. این انعطافپذیری به این معنی است که یک شرکت میتواند عاملی را هماهنگ کند که از GPT-4 OpenAI در کنار عامل دیگری که توسط یک مدل هوش مصنوعی متفاوت پشتیبانی میشود، استفاده کند، همه در یک چارچوب.
Agents SDK بر سازماندهی گردش کار متمرکز است - اساساً، پیگیری آنچه یک عامل انجام میدهد و چگونه وظایف را واگذار میکند. این مکانیسمهای داخلی را برای مواردی مانند موارد زیر فراهم میکند:
- عوامل قابل تنظیم: راهاندازی عوامل هوش مصنوعی با نقشهای از پیش تعریف شده یا دستورالعملهایی برای وظایف خاص.
- واگذاریهای هوشمند: انتقال وظایف بین چندین عامل یا فرآیند بر اساس زمینه (به عنوان مثال، یک عامل جمعآوری دادهها، سپس عامل دیگری آن را تجزیه و تحلیل میکند).
- حفاظت از ایمنی: اطمینان از اینکه عامل در محدوده معینی باقی میماند، با اعتبارسنجی ورودی و ابزارهای تعدیل محتوا برای جلوگیری از خروجیهای ناخواسته.
- ردیابی و مشاهدهپذیری: ابزارهایی برای نظارت و اشکالزدایی اقدامات یک عامل گام به گام، که به توسعهدهندگان کمک میکند تا تصمیمات را درک کرده و عملکرد را بهبود بخشند.
به گفته OpenAI، این جعبه ابزار میتواند موارد استفاده پیچیده مانند رباتهای پشتیبانی مشتری، دستیارهای تحقیق چند مرحلهای، گردش کار تولید محتوا، عوامل بررسی کد یا اتوماسیون احتمالی فروش را ساده کند. OpenAI با متنباز کردن SDK، همچنین مشارکتهای انجمن و پذیرش در محیطهای سازمانی را تشویق میکند، جایی که شفافیت و توانایی خود میزبانی اجزا اغلب مهم است. پذیرندگان اولیه از جمله شرکتهایی مانند Coinbase و Box قبلاً با Agents SDK برای ساخت تحقیقات مبتنی بر هوش مصنوعی و ابزارهای استخراج داده آزمایش کردهاند.
ابزارهای داخلی قابلیتهای هوش مصنوعی را افزایش میدهند
برای اینکه عوامل هوش مصنوعی از همان ابتدا کاربردیتر شوند، Responses API OpenAI با سه ابزار داخلی ارائه میشود که هوش مصنوعی را به دادهها و اقدامات خارجی متصل میکنند. این ابزارها به طور قابل توجهی آنچه را که یک عامل میتواند انجام دهد گسترش میدهند و فراتر از تولید متن صرف میروند.
ابزارهای داخلی موجود در زمان عرضه عبارتند از:
- جستجوی وب: به یک عامل هوش مصنوعی اجازه میدهد تا جستجوهای وب را در زمان واقعی انجام دهد و اطلاعات به روز را به همراه منابع ذکر شده بازیابی کند. این بدان معناست که یک عامل میتواند با استفاده از آخرین اخبار یا حقایق از اینترنت به سؤالات پاسخ دهد و مراجع را برای شفافیت ارائه دهد. این ابزار برای ساختن عواملی مانند دستیاران تحقیق، راهنمای خرید یا برنامهریزان سفر که به اطلاعات زنده نیاز دارند، مفید است.
- جستجوی فایل: به یک عامل اجازه میدهد تا به سرعت در مجموعههای بزرگ اسناد یا دادههایی که یک توسعهدهنده ارائه کرده است، جستجو کند تا اطلاعات مرتبط را پیدا کند. این اساساً یک ابزار پرس و جو از پایگاه دانش خصوصی است - یک عامل میتواند از آن برای پاسخ دادن به سوالات پشتیبانی مشتری با جستجوی اسناد سیاست یا کمک به تحقیقات حقوقی با بازیابی قسمتهایی از یک کتابخانه فایلها استفاده کند. این ابزار را میتوان در سناریوهایی مانند رباتهای خدمات مشتری یا دستیاران داخلی شرکت که نیاز به ارجاع به اطلاعات اختصاصی دارند، مستقر کرد.
- استفاده از رایانه: یک قابلیت جدید (در حال حاضر در پیش نمایش تحقیق) که به یک عامل هوش مصنوعی اجازه میدهد تا اقداماتی را روی یک رایانه انجام دهد، گویی که یک کاربر انسانی با دستگاه کار میکند. این ابزار که توسط مدل عامل استفاده کننده از رایانه OpenAI (CUA) پشتیبانی میشود، نیات هوش مصنوعی را به اقدامات صفحه کلید و ماوس برای پیمایش نرم افزار، وب سایتها یا سایر رابطهای دیجیتال ترجمه میکند. در اصل، این امکان اتوماسیون وظایفی را فراهم میکند که API آسانی ندارند - به عنوان مثال، وارد کردن دادهها در یک سیستم قدیمی، کلیک کردن از طریق یک برنامه وب برای آزمایش یا بررسی اطلاعات در یک رابط گرافیکی.
با ادغام این ابزارها، عوامل هوش مصنوعی نه تنها میتوانند به یک مشکل فکر کنند، بلکه میتوانند عمل کنند - چه به معنای جستجوی اطلاعات، بازیابی دادههای خاص یا دستکاری یک محیط دیجیتال. این امر تا حد زیادی عملکرد یک عامل را گسترش میدهد و آن را برای برنامههای کاربردی دنیای واقعی بسیار مفیدتر میکند.
OpenAI پیشبینی میکند که توسعهدهندگان این ابزارها را در صورت نیاز ترکیب میکنند؛ به عنوان مثال، یک عامل ممکن است از جستجوی وب برای جمعآوری اطلاعات عمومی و جستجوی فایل برای کشیدن دادههای داخلی استفاده کند، سپس از آن دانش ترکیبی برای تهیه یک گزارش یا اجرای یک کار استفاده کند. همه اینها را میتوان از طریق Responses API به روشی یکپارچه سازماندهی کرد، به جای اینکه به خدمات جداگانه یا ادغام دستی نیاز باشد.
پیامدهای گستردهتر برای پذیرش و دسترسی به هوش مصنوعی
تحلیلگران میگویند این عرضه میتواند با کاهش موانع فنی، پذیرش عوامل هوش مصنوعی را در صنایع مختلف تسریع کند. برای مشاغل، جذابیت این ابزارهای جدید، توانایی خودکارسازی و مقیاسبندی فرآیندها بدون توسعه سفارشی گسترده است.
وظایف معمول مانند بازیابی اطلاعات، پردازش فرم یا ورود دادههای بین برنامهای - که ممکن است به کدنویسی قابل توجه یا سیستمهای نرم افزاری متعدد نیاز داشته باشد - اکنون به طور بالقوه توسط عوامل هوش مصنوعی با استفاده از بلوکهای ساختمانی OpenAI قابل انجام است. به عنوان مثال، ابزارهای جستجوی داخلی به شرکتها اجازه میدهند تا تقریباً فوراً هوش مصنوعی را به پایگاههای دانش خود یا وب متصل کنند، و ابزار استفاده از رایانه راهی برای ارتباط با برنامههای قدیمی که API ندارند ارائه میدهد. در همین حال، ماهیت متنباز Agents SDK به شرکتها کنترل بیشتری میدهد و به آنها اجازه میدهد این عوامل هوش مصنوعی را در زیرساختهای موجود خود ادغام کنند و حتی در صورت نیاز از مدلهای هوش مصنوعی مختلف استفاده کنند.
اقدام OpenAI بخشی از یک رقابت گستردهتر برای توانمندسازی توسعهدهندگان با قابلیتهای ساخت عامل است. شرکتهای فناوری رقیب و استارتآپها، پلتفرمهای عامل هوش مصنوعی خود را عرضه کردهاند و جعبه ابزار جامع OpenAI ممکن است به آن کمک کند تا متمایز شود. در واقع، زمانبندی در بحبوحه افزایش علاقه به عوامل هوش مصنوعی مستقل در سطح جهانی انجام میشود - به عنوان مثال، استارتآپ چینی Monica اخیراً با عامل خود Manus توجهها را به خود جلب کرد و ادعا کرد که میتواند از عامل نمونه اولیه خود OpenAI در وظایف خاص بهتر عمل کند. به نظر میرسد OpenAI با متنباز کردن بخشهای کلیدی پلتفرم خود و ارائه ابزارهای داخلی، به فشار رقابتی پاسخ میدهد و در عین حال پذیرش گستردهتر هوش مصنوعی را تقویت میکند.
از دیدگاه دسترسی، این ابزارها میتوانند دموکراتیزه کنند که چه کسی میتواند سیستمهای پیشرفته هوش مصنوعی بسازد. شرکتهای کوچکتر و حتی توسعهدهندگان فردی ممکن است اکنون ایجاد یک دستیار یا گردش کار مبتنی بر هوش مصنوعی را بدون نیاز به یک تیم تحقیقاتی بزرگ امکانپذیر بدانند. رویکرد یکپارچه (جایی که یک فراخوانی API میتواند چندین مرحله را انجام دهد) و در دسترس بودن مثالها در مستندات OpenAI، مانع ورود را برای تازهواردان کاهش میدهد. OpenAI همچنین یک رابط مشاهدهپذیری برای توسعهدهندگان ارائه میدهد تا آنچه را که عامل انجام میدهد ردیابی و بررسی کنند، که برای اشکالزدایی و ایجاد اعتماد در خروجیهای هوش مصنوعی بسیار مهم است. انتظار میرود این تمرکز بر قابلیت استفاده و ایمنی (با حفاظت و نظارت) شرکتهای بیشتری را تشویق کند تا با عوامل هوش مصنوعی آزمایش کنند و بدانند که نظارت و کنترل دارند.
عوامل هوش مصنوعی میتوانند به اندازه داشتن یک حضور در اینترنت رایج و ضروری شوند. جدیدترین ابزارهای OpenAI، با قابل دسترستر کردن توسعه عامل، میتوانند به تبدیل آن چشمانداز به واقعیت کمک کنند و جامعه بسیار گستردهتری از توسعهدهندگان و سازمانها را قادر سازند تا عوامل خود را بسازند.