به نظر میرسد تغییری در برنامهها ایجاد شده است:
(برنامه اولیه مربوط به فوریه ۲۰۲۵ در اینجا قابل مشاهده است.)
در ادامه چند دیدگاه پراکنده دربارهی آنچه باید انتظار داشته باشیم ارائه میشود:
-
قابلیت «تحقیق عمیق» (Deep Research) واقعاً خوب است اما گران و کند است (از o3 استفاده میکند). o4-mini احتمالاً از نظر عملکرد در حد و اندازهی o3 خواهد بود اما محدودیتهای دیگر را برطرف خواهد کرد و بهترین دستیار پژوهشی هوش مصنوعی جهان را به طور گسترده، حتی برای کاربران رایگان با نرخ محدود، در دسترس قرار خواهد داد. (OpenAI آموخته است که در دسترس قرار دادن بیشتر محصولات، حتی اگر در کوتاهمدت منجر به ضرر مالی شود، در بلندمدت سودآور خواهد بود، مانند مورد شیدایی گیبلی (Ghibli frenzy)).
-
چرخههای تکرار به شدت کاهش یافتهاند. o1-preview در سپتامبر ۲۰۲۴ منتشر شد. نسخههای کامل o1 (و o1-pro) در دسامبر ۲۰۲۴ عرضه شدند. o3 طی دو هفته آینده (آوریل ۲۰۲۵) به همراه o4-mini عرضه خواهد شد (o4 احتمالاً آماده است اما هزینهی ارائه خدمات آن بسیار بالاست؛ فرض میکنم در نهایت در GPT-5 ادغام خواهد شد). زمان بازگشت بین نسلهای مدلهای استدلالی (o1، o3، o4) ۱۸ تا ۲۴ ماه نیست، مانند مدلهای پایه (GPT-2، GPT-3، GPT-4، GPT-5)، بلکه ۳ تا ۴ ماه است. این یک افزایش سرعت ۶ برابری است.
-
Google Gemini 2.5—احتمالاً برترین مدل هوش مصنوعی در بسیاری از حوزههای مهم (که به صورت رایگان و به راحتی در دسترس است)—OpenAI را مجبور کرده است که ادغام o3/o4-GPT-5 را کنار بگذارد و آنها را به طور جداگانه در دو مرحله عرضه کند. فکر میکنم آنها نگرانند که باقی ماندن در جایگاه دوم برای مدت طولانی—به خصوص در حالی که بهترین مدل گوگل رایگان است—میتواند منجر به از دست دادن کاربران شود. آنها از اینرسی برند ChatGPT برخوردارند و گوگل در بازاریابی افتضاح است—بیش از حد سنتی—اما این لزوماً یک برتری مسلم نیست.
-
آلتمن میگوید ادغام مدلهای استدلالی و پایه دشوارتر از آن چیزی است که فکر میکردند. اگر این مشکل حلنشده باقی بماند—هیچکس نمیداند چگونه مدلی را آموزش دهد که به طور دقیق تصمیم بگیرد چه زمانی استدلال کند و چه زمانی نه—آنها دو گزینه دارند: یا ارائه محصول را به سبک Anthropic ساده میکنند (هر مدل یک موجودیت بزرگ و یکپارچه است) یا آنها را جدا نگه میدارند تا زمانی که دیگر از نظر تجاری منطقی نباشد (چرا مدلهایی را ارائه دهیم که هیچکس استفاده نمیکند؟). در هر صورت، ارائه فعلی آنقدر گیجکننده است که تنها دلیل کارکرد آن این است که مردم فراتر از «ChatGPT» و ویژگیهای جذابی مانند حالت گیبلی (Ghibli mode) اهمیتی نمیدهند.
-
احتمال دیگری نیز وجود دارد: دلیل اینکه آنها در نهایت o3/o4 و GPT-5 را ادغام نمیکنند، میتواند این باشد که مدل دوم به تنهایی آنقدر درخشان است که نیازی به تقویت با قابلیتهای استدلالی از همان ابتدا ندارد. این بدان معناست که یا OpenAI اخیراً راهی برای اینقدر خوب کردن آن پیدا کرده است (از این رو تغییر برنامهها) یا اینکه «روز گیبلی» (Ghibli Day) به شدت به آنها یادآوری کرد که عموم مردم چندان به استدلال اهمیت نمیدهند.
-
اگر درست باشد که GPT-5 «بسیار بهتر از آنچه در ابتدا فکر میکردیم» خواهد بود—که به هر حال، من به آن باور دارم—این استدلالهای شکاکان را مبنی بر اینکه «فلات مقیاسپذیری با محاسبات زمان آزمون (test-time compute) حل نخواهد شد» یا «اگر OpenAI هنوز GPT-5 را عرضه نکرده به این دلیل است که انتظارات را برآورده نمیکند» زیر سوال خواهد برد.
-
با توجه به اینکه عرضه GPT-4.5 بر دانش جهانی، شهود و به طرز شگفتانگیزی، نوشتار خلاق متمرکز بود، فرض میکنم GPT-5 نیز همین روند را دنبال خواهد کرد، با این تفاوت که بهتر خواهد بود. قابلیتهای ریاضی، منطق و کدنویسی از طریق سری o معرفی خواهند شد، اما فکر نمیکنم GPT-5 در اکثر بنچمارکها از مدلهای برتر استدلالی پیشی بگیرد.
-
دلیل اینکه GPT-4.5 برای اکثر مردم کمتر از حد انتظار بود (من برداشت متفاوتی داشتم) دو دلیل دارد: اول، نتایج بنچمارک خوب نبودند. اما، البته! این یک مدل پایه است، نه مدلی که برای شکستن ارزیابیهای محبوب طراحی شده باشد، ارزیابیهایی که برای مدلهای استدلالی طراحی شدهاند—احساسات و سلیقه معیارهای جدید هستند. دوم، کند و بسیار گران است (۷۵ دلار برای ۱ میلیون توکن ورودی و ۱۵۰ دلار برای ۱ میلیون توکن خروجی). معتقدم این تا حدی به دلیل گران بودن آن و تا حدی یک تاکتیک برای جلوگیری از استفاده رقبا از آن برای تولید دادههای مصنوعی با کیفیت بالا است. با این حال، معتقدم OpenAI *باید* این وضعیت را برای GPT-5 اصلاح کند. آنها نمیتوانند اجازه دهند که حتی *احساس* ناامیدکنندگی ایجاد کند. بنابراین احتمالاً آن را نه تنها بهتر، بلکه سریعتر و/یا بسیار ارزانتر خواهند کرد.
-
به نظر میرسد در این مورد اشتباه میکردم که فکر میکردم OpenAI GPT-5 را به صورت داخلی برای بهبود مدلهای کوچکتر و ارزانتر از طریق تقطیر (distillation) نگه میدارد. شکی ندارم که آنها قبلاً از آن به صورت داخلی برای چندین منظور استفاده کردهاند (هیچ برتری عمدهای برای یک شرکت سازنده مدل هوش مصنوعی جز استفاده از هوش مصنوعی خود برای ساخت هوش مصنوعی بهتر وجود ندارد)، اما واضح است که آنها همچنان باید در جنگهای تجاری با گوگل بجنگند و به ساخت محصولات بهتر ادامه خواهند داد.