OpenAI اعلام کرده است عرضه مدل تولید تصویر چندوجهی خود، gpt-image-1، را به API، به توسعهدهندگان و کسبوکارها این امکان را میدهد تا قابلیتهای ایجاد تصویر را مستقیماً در ابزارها و پلتفرمهای خود ادغام کنند. این مدل، که قبلاً در ChatGPT معرفی شده بود، از تولید تصویر از اعلانهای متنی، ویرایش دقیق و ارائه دقیق سبکها و متن پشتیبانی میکند.
OpenAI گفت: "هنگامی که ماه گذشته تولید تصویر را در ChatGPT معرفی کردیم، به سرعت به یکی از محبوبترین ویژگیهای ما تبدیل شد." این شرکت به ایجاد بیش از 700 میلیون تصویر توسط 130 میلیون کاربر در هفته اول اشاره کرد.
مدل gpt-image-1 را میتوان در حوزههای مختلفی مانند تجارت الکترونیک، طراحی، آموزش، نرمافزار سازمانی و بازی استفاده کرد. این مدل از عملکردهایی از جمله تبدیل طرحها به تصاویر بصری صیقلی، ویرایش تصاویر موجود و تولید محتوای بازاریابی در مقیاس پشتیبانی میکند.
Adobe، Airtable، Figma، Gamma، HeyGen، OpusClip، Quora، Wix، Photoroom و Playground از جمله شرکتهایی هستند که در حال حاضر از این مدل استفاده میکنند.
به عنوان مثال، Adobe آن را در برنامههای Firefly و Express خود جاسازی میکند تا به کاربران امکان کاوش در سبکهای بصری مختلف را بدهد. کاربران Figma اکنون میتوانند تصاویر را در داخل پلتفرم ویرایش کنند و عناصری مانند اشیاء و پسزمینهها را از دستورالعملهای متنی تنظیم کنند.
Airtable از این مدل برای مقیاسبندی گردشهای کاری خلاقانه استفاده میکند. این شرکت اظهار داشت: "تیمهای بازاریابی سازمانی و خلاق میتوانند به راحتی گردشهای کاری دارایی را در مقیاس مدیریت کنند - از تولید مفاهیم کمپین گرفته تا ترکیب مجدد داراییها و بومیسازی رسانهها برای بازارهای بینالمللی."
OpusClip سازندگان YouTube را قادر میسازد تا تصاویر کوچک را با یک کلیک ایجاد کنند، در حالی که Quora در حال جایگزینی مدل تصویر موجود خود با gpt-image-1 برای بهبود کیفیت تولید است. Photoroom از آن برای ایجاد ابزارهایی مانند Product Beautifier و Virtual Model برای تصاویر تجارت الکترونیک استفاده میکند.
موارد استفاده جدید توسط شرکتهایی مانند Canva، GoDaddy، HubSpot، Instacart و invideo AI در حال آزمایش است. به عنوان مثال، GoDaddy در حال آزمایش تولید آرم و داراییهای رسانههای اجتماعی قابل ویرایش است، در حالی که Instacart در حال بررسی کاربرد آن برای تصاویر دستور غذا و تصاویر لیست خرید است.
API gpt-image-1 شامل ویژگیهای ایمنی مانند جلوگیری از تصویر مضر و فراداده C2PA تعبیه شده است. توسعهدهندگان همچنین میتوانند سطوح تعدیل محتوا را با استفاده از پارامتر تعدیل تنظیم کنند.
قیمتگذاری بر اساس میزان استفاده از توکن است. ورودی متن 5 دلار به ازای هر یک میلیون توکن، ورودی تصویر 10 دلار به ازای هر یک میلیون توکن و خروجی تصویر 40 دلار به ازای هر یک میلیون توکن هزینه دارد. OpenAI خاطرنشان کرد: "در عمل، این تقریباً به 0.02 دلار، 0.07 دلار و 0.19 دلار به ازای هر تصویر تولید شده برای تصاویر مربعی با کیفیت پایین، متوسط و بالا تبدیل میشود."
این مدل اکنون به صورت جهانی از طریق API Images در دسترس است. برخی از سازمانها ممکن است قبل از استفاده نیاز به تأیید دسترسی داشته باشند. توسعهدهندگان میتوانند قابلیتها را در زمین بازی API کاوش کرده و برای شروع به راهنمای تولید تصویر مراجعه کنند.