OpenAI
OpenAI

معرفی ابزارهای جدید OpenAI برای ساختن عوامل هوش مصنوعی

OpenAI پلتفرم توسعه‌دهندگان خود را با APIها و ابزارهای جدیدی گسترش می‌دهد که برای کمک به ایجاد سیستم‌های هوش مصنوعی خودمختار تواناتر طراحی شده‌اند.

Responses API جدید این شرکت، ویژگی‌های APIهای Chat Completions و Assistants را ترکیب می‌کند و به توسعه‌دهندگان یک پایه انعطاف‌پذیرتر برای ساخت برنامه‌های کاربردی عامل با قابلیت‌های یکپارچه جستجوی وب، مدیریت فایل و کنترل رایانه ارائه می‌دهد.

ابزار یکپارچه جستجوی وب از مدل‌های GPT-4o و GPT-4o-mini استفاده می‌کند و به ترتیب به دقت 90 و 88 درصد در SimpleQA factual query benchmark دست می‌یابد. درست مانند ChatGPT، این ابزار پاسخ‌های خود را با پیوند به مقالات خبری و پست‌های وبلاگ پشتیبانی می‌کند، که البته تضمینی برای پاسخ‌های درست نیست. توسعه‌دهندگان می‌توانند با پرداخت 30 یا 25 دلار به ازای هر هزار پرس و جو به این ویژگی دسترسی داشته باشند.

برای تیم‌هایی که با مجموعه‌های بزرگ اسناد کار می‌کنند، ابزار جدید جستجوی فایل باید یافتن اطلاعات خاص را آسان‌تر کند. هزینه آن 2.50 دلار به ازای هر هزار جستجو، به اضافه هزینه‌های ذخیره‌سازی 0.10 دلار به ازای هر گیگابایت در روز است.

شاید بلندپروازانه‌ترین ابزار، ابزاری باشد که به عوامل هوش مصنوعی اجازه می‌دهد کامپیوترها را کنترل کنند، که بر اساس همان فناوری عامل "Operator" OpenAI ساخته شده است. عامل استفاده‌کننده از رایانه (CUA) هنوز جای پیشرفت دارد و تنها 38.1 درصد موفقیت در انجام وظایف پیچیده دارد - به این معنی که نظارت انسانی در حال حاضر ضروری است.

این ویژگی کنترل رایانه هزینه‌ای معادل 3 دلار به ازای هر یک میلیون توکن ورودی و 12 دلار به ازای هر یک میلیون توکن خروجی دارد، اگرچه دسترسی در حال حاضر در مرحله پیش‌نمایش به توسعه‌دهندگان منتخب در سطوح 3-5 محدود شده است. برای کمک به تیم‌ها در نظارت بر عملکرد عوامل خود، OpenAI یک سیستم نظارت بر گردش کار ارائه می‌دهد.

توسعه‌دهندگان می‌توانند داده‌ها را مستقیماً در پلتفرم OpenAI ذخیره کنند تا عملکرد عامل را از طریق ردیابی و ارزیابی ارزیابی کنند. OpenAI تاکید می‌کند که داده‌های تجاری و کاربر به طور پیش‌فرض برای آموزش مدل‌های آن استفاده نخواهد شد.

ابزار جدید متن‌باز، توسعه را ساده می‌کند

Agents SDK متن‌باز جدید مدیریت گردش کارهای چندعاملی را با مدل‌های زبانی قابل تنظیم، تحویل عامل، کنترل‌های امنیتی داخلی و ابزارهای تجزیه و تحلیل ساده می‌کند. در حال حاضر برای پایتون در دسترس است و پشتیبانی از Node.js به زودی ارائه می‌شود، SDK با APIهای OpenAI و مدل‌های سایر ارائه‌دهندگان که از استاندارد Chat Completions پیروی می‌کنند، کار می‌کند.

در آینده، OpenAI قصد دارد API موجود Assistants را به نفع Responses API جدید تا اواسط سال 2026 حذف کند، پس از اینکه برابری ویژگی‌ها به دست آید. API Chat Completions به دریافت به‌روزرسانی‌ها و پشتیبانی برای توسعه‌دهندگانی که به ابزارهای یکپارچه نیاز ندارند، ادامه می‌دهد، اگرچه OpenAI انتقال به Responses API را برای قابلیت‌های گسترده‌تر آن توصیه می‌کند.