اسکرین‌شات توییت سم آلتمن
اسکرین‌شات توییت سم آلتمن

GPT-5، o3 و o4-mini به زودی عرضه می‌شوند

چند دیدگاه درباره‌ی آنچه باید انتظار داشته باشیم

اسکرین‌شات توییت سم آلتمن درباره تغییر برنامه عرضه مدل‌های جدید OpenAI
اسکرین‌شات توییت سم آلتمن

به نظر می‌رسد تغییری در برنامه‌ها ایجاد شده است:

(برنامه اولیه مربوط به فوریه ۲۰۲۵ در اینجا قابل مشاهده است.)

در ادامه چند دیدگاه پراکنده درباره‌ی آنچه باید انتظار داشته باشیم ارائه می‌شود:

  • قابلیت «تحقیق عمیق» (Deep Research) واقعاً خوب است اما گران و کند است (از o3 استفاده می‌کند). o4-mini احتمالاً از نظر عملکرد در حد و اندازه‌ی o3 خواهد بود اما محدودیت‌های دیگر را برطرف خواهد کرد و بهترین دستیار پژوهشی هوش مصنوعی جهان را به طور گسترده، حتی برای کاربران رایگان با نرخ محدود، در دسترس قرار خواهد داد. (OpenAI آموخته است که در دسترس قرار دادن بیشتر محصولات، حتی اگر در کوتاه‌مدت منجر به ضرر مالی شود، در بلندمدت سودآور خواهد بود، مانند مورد شیدایی گیبلی (Ghibli frenzy)).

  • چرخه‌های تکرار به شدت کاهش یافته‌اند. o1-preview در سپتامبر ۲۰۲۴ منتشر شد. نسخه‌های کامل o1 (و o1-pro) در دسامبر ۲۰۲۴ عرضه شدند. o3 طی دو هفته آینده (آوریل ۲۰۲۵) به همراه o4-mini عرضه خواهد شد (o4 احتمالاً آماده است اما هزینه‌ی ارائه خدمات آن بسیار بالاست؛ فرض می‌کنم در نهایت در GPT-5 ادغام خواهد شد). زمان بازگشت بین نسل‌های مدل‌های استدلالی (o1، o3، o4) ۱۸ تا ۲۴ ماه نیست، مانند مدل‌های پایه (GPT-2، GPT-3، GPT-4، GPT-5)، بلکه ۳ تا ۴ ماه است. این یک افزایش سرعت ۶ برابری است.

  • Google Gemini 2.5—احتمالاً برترین مدل هوش مصنوعی در بسیاری از حوزه‌های مهم (که به صورت رایگان و به راحتی در دسترس است)—OpenAI را مجبور کرده است که ادغام o3/o4-GPT-5 را کنار بگذارد و آن‌ها را به طور جداگانه در دو مرحله عرضه کند. فکر می‌کنم آن‌ها نگرانند که باقی ماندن در جایگاه دوم برای مدت طولانی—به خصوص در حالی که بهترین مدل گوگل رایگان است—می‌تواند منجر به از دست دادن کاربران شود. آن‌ها از اینرسی برند ChatGPT برخوردارند و گوگل در بازاریابی افتضاح است—بیش از حد سنتی—اما این لزوماً یک برتری مسلم نیست.

  • آلتمن می‌گوید ادغام مدل‌های استدلالی و پایه دشوارتر از آن چیزی است که فکر می‌کردند. اگر این مشکل حل‌نشده باقی بماند—هیچ‌کس نمی‌داند چگونه مدلی را آموزش دهد که به طور دقیق تصمیم بگیرد چه زمانی استدلال کند و چه زمانی نه—آن‌ها دو گزینه دارند: یا ارائه محصول را به سبک Anthropic ساده می‌کنند (هر مدل یک موجودیت بزرگ و یکپارچه است) یا آن‌ها را جدا نگه می‌دارند تا زمانی که دیگر از نظر تجاری منطقی نباشد (چرا مدل‌هایی را ارائه دهیم که هیچ‌کس استفاده نمی‌کند؟). در هر صورت، ارائه فعلی آنقدر گیج‌کننده است که تنها دلیل کارکرد آن این است که مردم فراتر از «ChatGPT» و ویژگی‌های جذابی مانند حالت گیبلی (Ghibli mode) اهمیتی نمی‌دهند.

  • احتمال دیگری نیز وجود دارد: دلیل اینکه آن‌ها در نهایت o3/o4 و GPT-5 را ادغام نمی‌کنند، می‌تواند این باشد که مدل دوم به تنهایی آنقدر درخشان است که نیازی به تقویت با قابلیت‌های استدلالی از همان ابتدا ندارد. این بدان معناست که یا OpenAI اخیراً راهی برای اینقدر خوب کردن آن پیدا کرده است (از این رو تغییر برنامه‌ها) یا اینکه «روز گیبلی» (Ghibli Day) به شدت به آن‌ها یادآوری کرد که عموم مردم چندان به استدلال اهمیت نمی‌دهند.

  • اگر درست باشد که GPT-5 «بسیار بهتر از آنچه در ابتدا فکر می‌کردیم» خواهد بود—که به هر حال، من به آن باور دارم—این استدلال‌های شکاکان را مبنی بر اینکه «فلات مقیاس‌پذیری با محاسبات زمان آزمون (test-time compute) حل نخواهد شد» یا «اگر OpenAI هنوز GPT-5 را عرضه نکرده به این دلیل است که انتظارات را برآورده نمی‌کند» زیر سوال خواهد برد.

  • با توجه به اینکه عرضه GPT-4.5 بر دانش جهانی، شهود و به طرز شگفت‌انگیزی، نوشتار خلاق متمرکز بود، فرض می‌کنم GPT-5 نیز همین روند را دنبال خواهد کرد، با این تفاوت که بهتر خواهد بود. قابلیت‌های ریاضی، منطق و کدنویسی از طریق سری o معرفی خواهند شد، اما فکر نمی‌کنم GPT-5 در اکثر بنچمارک‌ها از مدل‌های برتر استدلالی پیشی بگیرد.

  • دلیل اینکه GPT-4.5 برای اکثر مردم کمتر از حد انتظار بود (من برداشت متفاوتی داشتم) دو دلیل دارد: اول، نتایج بنچمارک خوب نبودند. اما، البته! این یک مدل پایه است، نه مدلی که برای شکستن ارزیابی‌های محبوب طراحی شده باشد، ارزیابی‌هایی که برای مدل‌های استدلالی طراحی شده‌اند—احساسات و سلیقه معیارهای جدید هستند. دوم، کند و بسیار گران است (۷۵ دلار برای ۱ میلیون توکن ورودی و ۱۵۰ دلار برای ۱ میلیون توکن خروجی). معتقدم این تا حدی به دلیل گران بودن آن و تا حدی یک تاکتیک برای جلوگیری از استفاده رقبا از آن برای تولید داده‌های مصنوعی با کیفیت بالا است. با این حال، معتقدم OpenAI *باید* این وضعیت را برای GPT-5 اصلاح کند. آن‌ها نمی‌توانند اجازه دهند که حتی *احساس* ناامیدکنندگی ایجاد کند. بنابراین احتمالاً آن را نه تنها بهتر، بلکه سریع‌تر و/یا بسیار ارزان‌تر خواهند کرد.

  • به نظر می‌رسد در این مورد اشتباه می‌کردم که فکر می‌کردم OpenAI GPT-5 را به صورت داخلی برای بهبود مدل‌های کوچک‌تر و ارزان‌تر از طریق تقطیر (distillation) نگه می‌دارد. شکی ندارم که آن‌ها قبلاً از آن به صورت داخلی برای چندین منظور استفاده کرده‌اند (هیچ برتری عمده‌ای برای یک شرکت سازنده مدل هوش مصنوعی جز استفاده از هوش مصنوعی خود برای ساخت هوش مصنوعی بهتر وجود ندارد)، اما واضح است که آن‌ها همچنان باید در جنگ‌های تجاری با گوگل بجنگند و به ساخت محصولات بهتر ادامه خواهند داد.