منبع: OpenAI
منبع: OpenAI

کاهش موانع توسعه‌دهندگان با ساده‌سازی ساخت عامل هوش مصنوعی توسط OpenAI

OpenAI اخیراً مجموعه‌ای از ابزارهای توسعه‌دهنده جدید را با هدف تسهیل ایجاد عوامل هوش مصنوعی منتشر کرده است که می‌توانند وظایف پیچیده را به طور خودکار انجام دهند. این به‌روزرسانی که هفته گذشته اعلام شد، شامل Responses API، یک Agents SDK متن‌باز و ابزارهای داخلی برای جستجوی وب، جستجوی فایل و کنترل رایانه است؛ همگی برای ساده‌سازی نحوه تعامل سیستم‌های هوش مصنوعی با اطلاعات و برنامه‌های کاربردی دنیای واقعی طراحی شده‌اند.

OpenAI این عوامل را به عنوان "سیستم‌هایی که به طور مستقل وظایف را از طرف کاربران انجام می‌دهند" توصیف می‌کند، به این معنی که آنها می‌توانند فرآیندهای چند مرحله‌ای - مانند تحقیق در مورد یک موضوع یا به روز رسانی یک پایگاه داده - را با حداقل راهنمایی انسانی انجام دهند. هدف این شرکت کاهش موانع برای توسعه‌دهندگان و مشاغل در جهت استقرار دستیارهای قدرتمند مبتنی بر هوش مصنوعی است، در نتیجه دسترسی به قابلیت‌های پیشرفته هوش مصنوعی را گسترش می‌دهد.

Responses API: ساده‌سازی تعاملات عامل

در قلب اطلاعیه OpenAI، Responses API جدید قرار دارد که به عنوان یک رابط واحد برای ساخت عوامل هوش مصنوعی عمل می‌کند. این API توانایی‌های مکالمه‌ای Chat Completions API OpenAI را با قابلیت استفاده از ابزار API قبلی Assistants ترکیب می‌کند. به عبارت عملی، این بدان معناست که یک فراخوانی API واحد اکنون می‌تواند وظایف پیچیده و چند مرحله‌ای را که ممکن است شامل فراخوانی ابزارهای مختلف یا منابع دانش باشد، انجام دهد.

OpenAI می‌گوید Responses API برای ساده‌سازی توسعه عامل با کاهش نیاز به کد سفارشی و دستکاری سریع ساخته شده است. این شرکت در پست وبلاگ اعلامیه خود توضیح داد: "Responses API برای توسعه‌دهندگانی طراحی شده است که می‌خواهند به راحتی مدل‌های OpenAI و ابزارهای داخلی را در برنامه‌های خود ترکیب کنند، بدون پیچیدگی ادغام APIهای متعدد یا فروشندگان خارجی." پیش از این، توسعه‌دهندگان اغلب مجبور بودند چندین فراخوانی API را سازماندهی کرده و سریع‌های دقیقی را برای وادار کردن یک عامل هوش مصنوعی به انجام کاری مفید ایجاد کنند، که این کار چالش‌برانگیز و زمان‌بر بود. با API جدید، یک عامل می‌تواند، به عنوان مثال، با یک کاربر مکالمه کند، اطلاعات را از طریق جستجوی وب جستجو کند، سپس یک خلاصه بنویسد - همه در یک گردش کار.

شایان ذکر است، Responses API برای همه توسعه‌دهندگان بدون هیچ هزینه اضافی فراتر از هزینه‌های استاندارد استفاده در دسترس است. همچنین با نسخه‌های قبلی سازگار است: OpenAI تأیید کرده است که به پشتیبانی از Chat Completions API محبوب خود برای موارد استفاده ساده ادامه خواهد داد، در حالی که Assistants API قدیمی تا اواسط سال 2026 به تدریج حذف خواهد شد زیرا ویژگی‌های آن در Responses API گنجانده شده است.

Agents SDK متن‌باز، سازماندهی گردش کار را ساده می‌کند

این عرضه همچنین شامل Agents SDK، یک جعبه ابزار برای مدیریت گردش کار یک یا حتی چند عامل هوش مصنوعی در تعامل است. در یک اقدام قابل توجه، OpenAI این SDK را به صورت متن‌باز درآورده است و به توسعه‌دهندگان و شرکت‌ها اجازه می‌دهد تا کد را بازرسی کنند و حتی مدل‌های غیر OpenAI را در سیستم‌های عامل خود ادغام کنند. این انعطاف‌پذیری به این معنی است که یک شرکت می‌تواند عاملی را هماهنگ کند که از GPT-4 OpenAI در کنار عامل دیگری که توسط یک مدل هوش مصنوعی متفاوت پشتیبانی می‌شود، استفاده کند، همه در یک چارچوب.

Agents SDK بر سازماندهی گردش کار متمرکز است - اساساً، پیگیری آنچه یک عامل انجام می‌دهد و چگونه وظایف را واگذار می‌کند. این مکانیسم‌های داخلی را برای مواردی مانند موارد زیر فراهم می‌کند:

  • عوامل قابل تنظیم: راه‌اندازی عوامل هوش مصنوعی با نقش‌های از پیش تعریف شده یا دستورالعمل‌هایی برای وظایف خاص.
  • واگذاری‌های هوشمند: انتقال وظایف بین چندین عامل یا فرآیند بر اساس زمینه (به عنوان مثال، یک عامل جمع‌آوری داده‌ها، سپس عامل دیگری آن را تجزیه و تحلیل می‌کند).
  • حفاظت از ایمنی: اطمینان از اینکه عامل در محدوده معینی باقی می‌ماند، با اعتبارسنجی ورودی و ابزارهای تعدیل محتوا برای جلوگیری از خروجی‌های ناخواسته.
  • ردیابی و مشاهده‌پذیری: ابزارهایی برای نظارت و اشکال‌زدایی اقدامات یک عامل گام به گام، که به توسعه‌دهندگان کمک می‌کند تا تصمیمات را درک کرده و عملکرد را بهبود بخشند.

به گفته OpenAI، این جعبه ابزار می‌تواند موارد استفاده پیچیده مانند ربات‌های پشتیبانی مشتری، دستیارهای تحقیق چند مرحله‌ای، گردش کار تولید محتوا، عوامل بررسی کد یا اتوماسیون احتمالی فروش را ساده کند. OpenAI با متن‌باز کردن SDK، همچنین مشارکت‌های انجمن و پذیرش در محیط‌های سازمانی را تشویق می‌کند، جایی که شفافیت و توانایی خود میزبانی اجزا اغلب مهم است. پذیرندگان اولیه از جمله شرکت‌هایی مانند Coinbase و Box قبلاً با Agents SDK برای ساخت تحقیقات مبتنی بر هوش مصنوعی و ابزارهای استخراج داده آزمایش کرده‌اند.

ابزارهای داخلی قابلیت‌های هوش مصنوعی را افزایش می‌دهند

برای اینکه عوامل هوش مصنوعی از همان ابتدا کاربردی‌تر شوند، Responses API OpenAI با سه ابزار داخلی ارائه می‌شود که هوش مصنوعی را به داده‌ها و اقدامات خارجی متصل می‌کنند. این ابزارها به طور قابل توجهی آنچه را که یک عامل می‌تواند انجام دهد گسترش می‌دهند و فراتر از تولید متن صرف می‌روند.

ابزارهای داخلی موجود در زمان عرضه عبارتند از:

  • جستجوی وب: به یک عامل هوش مصنوعی اجازه می‌دهد تا جستجوهای وب را در زمان واقعی انجام دهد و اطلاعات به روز را به همراه منابع ذکر شده بازیابی کند. این بدان معناست که یک عامل می‌تواند با استفاده از آخرین اخبار یا حقایق از اینترنت به سؤالات پاسخ دهد و مراجع را برای شفافیت ارائه دهد. این ابزار برای ساختن عواملی مانند دستیاران تحقیق، راهنمای خرید یا برنامه‌ریزان سفر که به اطلاعات زنده نیاز دارند، مفید است.
  • جستجوی فایل: به یک عامل اجازه می‌دهد تا به سرعت در مجموعه‌های بزرگ اسناد یا داده‌هایی که یک توسعه‌دهنده ارائه کرده است، جستجو کند تا اطلاعات مرتبط را پیدا کند. این اساساً یک ابزار پرس و جو از پایگاه دانش خصوصی است - یک عامل می‌تواند از آن برای پاسخ دادن به سوالات پشتیبانی مشتری با جستجوی اسناد سیاست یا کمک به تحقیقات حقوقی با بازیابی قسمت‌هایی از یک کتابخانه فایل‌ها استفاده کند. این ابزار را می‌توان در سناریوهایی مانند ربات‌های خدمات مشتری یا دستیاران داخلی شرکت که نیاز به ارجاع به اطلاعات اختصاصی دارند، مستقر کرد.
  • استفاده از رایانه: یک قابلیت جدید (در حال حاضر در پیش نمایش تحقیق) که به یک عامل هوش مصنوعی اجازه می‌دهد تا اقداماتی را روی یک رایانه انجام دهد، گویی که یک کاربر انسانی با دستگاه کار می‌کند. این ابزار که توسط مدل عامل استفاده کننده از رایانه OpenAI (CUA) پشتیبانی می‌شود، نیات هوش مصنوعی را به اقدامات صفحه کلید و ماوس برای پیمایش نرم افزار، وب سایت‌ها یا سایر رابط‌های دیجیتال ترجمه می‌کند. در اصل، این امکان اتوماسیون وظایفی را فراهم می‌کند که API آسانی ندارند - به عنوان مثال، وارد کردن داده‌ها در یک سیستم قدیمی، کلیک کردن از طریق یک برنامه وب برای آزمایش یا بررسی اطلاعات در یک رابط گرافیکی.

با ادغام این ابزارها، عوامل هوش مصنوعی نه تنها می‌توانند به یک مشکل فکر کنند، بلکه می‌توانند عمل کنند - چه به معنای جستجوی اطلاعات، بازیابی داده‌های خاص یا دستکاری یک محیط دیجیتال. این امر تا حد زیادی عملکرد یک عامل را گسترش می‌دهد و آن را برای برنامه‌های کاربردی دنیای واقعی بسیار مفیدتر می‌کند.

OpenAI پیش‌بینی می‌کند که توسعه‌دهندگان این ابزارها را در صورت نیاز ترکیب می‌کنند؛ به عنوان مثال، یک عامل ممکن است از جستجوی وب برای جمع‌آوری اطلاعات عمومی و جستجوی فایل برای کشیدن داده‌های داخلی استفاده کند، سپس از آن دانش ترکیبی برای تهیه یک گزارش یا اجرای یک کار استفاده کند. همه اینها را می‌توان از طریق Responses API به روشی یکپارچه سازماندهی کرد، به جای اینکه به خدمات جداگانه یا ادغام دستی نیاز باشد.

پیامدهای گسترده‌تر برای پذیرش و دسترسی به هوش مصنوعی

تحلیلگران می‌گویند این عرضه می‌تواند با کاهش موانع فنی، پذیرش عوامل هوش مصنوعی را در صنایع مختلف تسریع کند. برای مشاغل، جذابیت این ابزارهای جدید، توانایی خودکارسازی و مقیاس‌بندی فرآیندها بدون توسعه سفارشی گسترده است.

وظایف معمول مانند بازیابی اطلاعات، پردازش فرم یا ورود داده‌های بین برنامه‌ای - که ممکن است به کدنویسی قابل توجه یا سیستم‌های نرم افزاری متعدد نیاز داشته باشد - اکنون به طور بالقوه توسط عوامل هوش مصنوعی با استفاده از بلوک‌های ساختمانی OpenAI قابل انجام است. به عنوان مثال، ابزارهای جستجوی داخلی به شرکت‌ها اجازه می‌دهند تا تقریباً فوراً هوش مصنوعی را به پایگاه‌های دانش خود یا وب متصل کنند، و ابزار استفاده از رایانه راهی برای ارتباط با برنامه‌های قدیمی که API ندارند ارائه می‌دهد. در همین حال، ماهیت متن‌باز Agents SDK به شرکت‌ها کنترل بیشتری می‌دهد و به آنها اجازه می‌دهد این عوامل هوش مصنوعی را در زیرساخت‌های موجود خود ادغام کنند و حتی در صورت نیاز از مدل‌های هوش مصنوعی مختلف استفاده کنند.

اقدام OpenAI بخشی از یک رقابت گسترده‌تر برای توانمندسازی توسعه‌دهندگان با قابلیت‌های ساخت عامل است. شرکت‌های فناوری رقیب و استارت‌آپ‌ها، پلتفرم‌های عامل هوش مصنوعی خود را عرضه کرده‌اند و جعبه ابزار جامع OpenAI ممکن است به آن کمک کند تا متمایز شود. در واقع، زمان‌بندی در بحبوحه افزایش علاقه به عوامل هوش مصنوعی مستقل در سطح جهانی انجام می‌شود - به عنوان مثال، استارت‌آپ چینی Monica اخیراً با عامل خود Manus توجه‌ها را به خود جلب کرد و ادعا کرد که می‌تواند از عامل نمونه اولیه خود OpenAI در وظایف خاص بهتر عمل کند. به نظر می‌رسد OpenAI با متن‌باز کردن بخش‌های کلیدی پلتفرم خود و ارائه ابزارهای داخلی، به فشار رقابتی پاسخ می‌دهد و در عین حال پذیرش گسترده‌تر هوش مصنوعی را تقویت می‌کند.

از دیدگاه دسترسی، این ابزارها می‌توانند دموکراتیزه کنند که چه کسی می‌تواند سیستم‌های پیشرفته هوش مصنوعی بسازد. شرکت‌های کوچک‌تر و حتی توسعه‌دهندگان فردی ممکن است اکنون ایجاد یک دستیار یا گردش کار مبتنی بر هوش مصنوعی را بدون نیاز به یک تیم تحقیقاتی بزرگ امکان‌پذیر بدانند. رویکرد یکپارچه (جایی که یک فراخوانی API می‌تواند چندین مرحله را انجام دهد) و در دسترس بودن مثال‌ها در مستندات OpenAI، مانع ورود را برای تازه‌واردان کاهش می‌دهد. OpenAI همچنین یک رابط مشاهده‌پذیری برای توسعه‌دهندگان ارائه می‌دهد تا آنچه را که عامل انجام می‌دهد ردیابی و بررسی کنند، که برای اشکال‌زدایی و ایجاد اعتماد در خروجی‌های هوش مصنوعی بسیار مهم است. انتظار می‌رود این تمرکز بر قابلیت استفاده و ایمنی (با حفاظت و نظارت) شرکت‌های بیشتری را تشویق کند تا با عوامل هوش مصنوعی آزمایش کنند و بدانند که نظارت و کنترل دارند.

عوامل هوش مصنوعی می‌توانند به اندازه داشتن یک حضور در اینترنت رایج و ضروری شوند. جدیدترین ابزارهای OpenAI، با قابل دسترس‌تر کردن توسعه عامل، می‌توانند به تبدیل آن چشم‌انداز به واقعیت کمک کنند و جامعه بسیار گسترده‌تری از توسعه‌دهندگان و سازمان‌ها را قادر سازند تا عوامل خود را بسازند.