OpenAI مدل تولید تصویر را از طریق gpt-image-1 به API می‌آورد

OpenAI اعلام کرده است عرضه مدل تولید تصویر چندوجهی خود، gpt-image-1، را به API، به توسعه‌دهندگان و کسب‌وکارها این امکان را می‌دهد تا قابلیت‌های ایجاد تصویر را مستقیماً در ابزارها و پلتفرم‌های خود ادغام کنند. این مدل، که قبلاً در ChatGPT معرفی شده بود، از تولید تصویر از اعلان‌های متنی، ویرایش دقیق و ارائه دقیق سبک‌ها و متن پشتیبانی می‌کند.

OpenAI گفت: "هنگامی که ماه گذشته تولید تصویر را در ChatGPT معرفی کردیم، به سرعت به یکی از محبوب‌ترین ویژگی‌های ما تبدیل شد." این شرکت به ایجاد بیش از 700 میلیون تصویر توسط 130 میلیون کاربر در هفته اول اشاره کرد.

مدل gpt-image-1 را می‌توان در حوزه‌های مختلفی مانند تجارت الکترونیک، طراحی، آموزش، نرم‌افزار سازمانی و بازی استفاده کرد. این مدل از عملکردهایی از جمله تبدیل طرح‌ها به تصاویر بصری صیقلی، ویرایش تصاویر موجود و تولید محتوای بازاریابی در مقیاس پشتیبانی می‌کند.

Adobe، Airtable، Figma، Gamma، HeyGen، OpusClip، Quora، Wix، Photoroom و Playground از جمله شرکت‌هایی هستند که در حال حاضر از این مدل استفاده می‌کنند.

به عنوان مثال، Adobe آن را در برنامه‌های Firefly و Express خود جاسازی می‌کند تا به کاربران امکان کاوش در سبک‌های بصری مختلف را بدهد. کاربران Figma اکنون می‌توانند تصاویر را در داخل پلتفرم ویرایش کنند و عناصری مانند اشیاء و پس‌زمینه‌ها را از دستورالعمل‌های متنی تنظیم کنند.

Airtable از این مدل برای مقیاس‌بندی گردش‌های کاری خلاقانه استفاده می‌کند. این شرکت اظهار داشت: "تیم‌های بازاریابی سازمانی و خلاق می‌توانند به راحتی گردش‌های کاری دارایی را در مقیاس مدیریت کنند - از تولید مفاهیم کمپین گرفته تا ترکیب مجدد دارایی‌ها و بومی‌سازی رسانه‌ها برای بازارهای بین‌المللی."

OpusClip سازندگان YouTube را قادر می‌سازد تا تصاویر کوچک را با یک کلیک ایجاد کنند، در حالی که Quora در حال جایگزینی مدل تصویر موجود خود با gpt-image-1 برای بهبود کیفیت تولید است. Photoroom از آن برای ایجاد ابزارهایی مانند Product Beautifier و Virtual Model برای تصاویر تجارت الکترونیک استفاده می‌کند.

موارد استفاده جدید توسط شرکت‌هایی مانند Canva، GoDaddy، HubSpot، Instacart و invideo AI در حال آزمایش است. به عنوان مثال، GoDaddy در حال آزمایش تولید آرم و دارایی‌های رسانه‌های اجتماعی قابل ویرایش است، در حالی که Instacart در حال بررسی کاربرد آن برای تصاویر دستور غذا و تصاویر لیست خرید است.

API gpt-image-1 شامل ویژگی‌های ایمنی مانند جلوگیری از تصویر مضر و فراداده C2PA تعبیه شده است. توسعه‌دهندگان همچنین می‌توانند سطوح تعدیل محتوا را با استفاده از پارامتر تعدیل تنظیم کنند.

قیمت‌گذاری بر اساس میزان استفاده از توکن است. ورودی متن 5 دلار به ازای هر یک میلیون توکن، ورودی تصویر 10 دلار به ازای هر یک میلیون توکن و خروجی تصویر 40 دلار به ازای هر یک میلیون توکن هزینه دارد. OpenAI خاطرنشان کرد: "در عمل، این تقریباً به 0.02 دلار، 0.07 دلار و 0.19 دلار به ازای هر تصویر تولید شده برای تصاویر مربعی با کیفیت پایین، متوسط و بالا تبدیل می‌شود."

این مدل اکنون به صورت جهانی از طریق API Images در دسترس است. برخی از سازمان‌ها ممکن است قبل از استفاده نیاز به تأیید دسترسی داشته باشند. توسعه‌دهندگان می‌توانند قابلیت‌ها را در زمین بازی API کاوش کرده و برای شروع به راهنمای تولید تصویر مراجعه کنند.

برچسب‌ها OpenAI تولید تصویر API gpt-image-1 هوش مصنوعی یادگیری ماشین تولید تصویر هوش مصنوعی

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: analyticsindiamag.com