دو سال از زمانی که OpenAI با معرفی ChatGPT عصر هوش مصنوعی مولد را به اوج رساند، در یک چشم به هم زدن گذشت. OpenAI و رقبای اصلی آن، Anthropic، Google و Meta، مجموعه‌ای از مدل‌های پیشرفته هوش مصنوعی را منتشر کرده‌اند که هر کدام از دیگری ماهرتر است. اکنون دره سیلیکون معتقد است که قدرت محاسباتی بیشتر، داده‌های بیشتر و مدل‌های بزرگتر منجر به بهبودهای اساسی در هوش مصنوعی خواهد شد که این فناوری در چند سال آینده صنایع کامل را متحول خواهد کرد.

و با این حال، تهدیدهایی برای سرعت توسعه حتی قبل از دومین سالگرد ChatGPT ظاهر شدند. در سال ۲۰۲۴، OpenAI و دو شرکت پیشرو دیگر در هوش مصنوعی با موانعی روبرو شدند. در OpenAI و Google، برخی از نرم‌افزارها نتوانستند به انتظارات داخلی برسند، در حالی که جدول زمانی یک مدل مورد انتظار از Anthropic، که توسط کارکنان سابق OpenAI ساخته شده بود، پس از اعلام قبلی به تعویق افتاد. اگر پیشرفت در هوش مصنوعی مولد به طریقی پایدار کند شود، این سوال را به وجود خواهد آورد که آیا این فناوری می‌تواند به وعده‌های گسترده‌تری که نوآوران برتر صنعت برای آن داده‌اند، دست یابد یا خیر. شناسایی راه‌هایی برای پیشبرد رونق هوش مصنوعی به مرحله بعدی آن، چالش اصلی این حوزه در سال ۲۰۲۵ خواهد بود.

شرکت‌ها با چندین مانع روبرو هستند. یافتن منابع جدید داده‌های آموزشی با کیفیت بالا و انسانی برای ساخت سیستم‌های پیشرفته‌تر هوش مصنوعی دشوارتر شده است. علاوه بر این، حتی بهبودهای جزئی در عملکرد هوش مصنوعی ممکن است برای توجیه هزینه‌های هنگفت مرتبط با ایجاد و بهره‌برداری از مدل‌های جدید کافی نباشد. داریو آمودی، مدیرعامل Anthropic، گفته است که هزینه آموزش یک مدل پیشرفته حدود ۱۰۰ میلیون دلار است و انتظار دارد این مبلغ در سال‌های آینده به ۱۰۰ میلیارد دلار برسد. سارا فرایر، مدیر مالی OpenAI، می‌گوید که می‌توان گفت مدل پیشرفته بعدی شرکت میلیاردها دلار هزینه خواهد داشت و هنوز نیاز به مدل‌های بزرگتر و گران‌تر وجود دارد.

AI Giants
تصویر: غول‌های هوش مصنوعی
AI Development
تصویر: توسعه هوش مصنوعی

این مسائل تردیدهایی را درباره میلیاردها دلاری که قبلاً در هوش مصنوعی سرمایه‌گذاری شده و هدفی که این شرکت‌ها به شدت دنبال می‌کنند - یعنی هوش مصنوعی عمومی یا AGI که می‌تواند در طیف گسترده‌ای از وظایف با انسان‌ها برابری یا برتری کند - به وجود می‌آورد. مدیران عامل OpenAI و Anthropic قبلاً گفته‌اند که AGI ممکن است تنها چند سال فاصله داشته باشد و هر دو هرگونه پیشنهاد مبنی بر اینکه به دیوار برخورد کرده‌اند را رد کرده‌اند. با این حال، دیگر رهبران صنعت لحنی متواضع‌تر دارند. «فکر می‌کنم پیشرفت سخت‌تر خواهد شد»، مدیرعامل Google، سوندار پیچای، در مصاحبه‌ای در اجلاس DealBook نیویورک تایمز در اوایل دسامبر گفت. به سال ۲۰۲۵ نگاه می‌کنیم، او گفت: «میوه‌های دم‌دست تمام شده‌اند، تپه شیب‌دارتر است.»

در صنعتی که به نوآوری افتخار می‌کند، شرکت‌ها به دنبال راه‌های مختلفی برای پیشبرد مدل‌های هوش مصنوعی هستند. تلاش‌های در حال انجام شامل این است که کامپیوترها را به تقلید از نحوه تفکر انسان‌ها درباره یک مشکل برای حل بهتر آن وادار کنند، مدل‌هایی بسازند که در انواع خاصی از وظایف واقعاً خوب باشند و هوش مصنوعی را با داده‌هایی که خود هوش مصنوعی تولید کرده است آموزش دهند.

به طور خاص، OpenAI از هوش مصنوعی که می‌تواند استدلال انسانی را برای پاسخ به سوالات پیچیده‌تر و بهبود در طول زمان انجام دهد، حمایت اولیه کرده است، به ویژه در مورد سوالات مربوط به ریاضیات، علوم و کدنویسی. در سپتامبر، این شرکت نسخه اولیه یک مدل به نام o1 را معرفی کرد که این کار را با صرف زمان بیشتر برای محاسبه یک پاسخ قبل از پاسخ دادن به سوال کاربر انجام می‌دهد. OpenAI نسخه بهبود یافته‌ای از آن مدل را در دسامبر اعلام کرد که مدیرعامل سام آلتمن در شبکه‌های اجتماعی به آن به عنوان «باهوش‌ترین مدل در جهان» اشاره کرد.

AI Model
تصویر: مدل هوش مصنوعی

این شرکت به قدری به o1 اطمینان دارد که شروع به ارائه اشتراک ماهانه ۲۰۰ دلاری کرده است که شامل، در میان ویژگی‌های دیگر، دسترسی به نسخه‌ای از مدل است که می‌تواند از قدرت محاسباتی بیشتری برای پاسخ به سوالات استفاده کند.

چندین شرکت دیگر، از جمله Google و سازنده نرم‌افزار Databricks، در حال کار بر روی نسخه‌های خود از این رویکرد هستند که اغلب به عنوان محاسبات زمان آزمون یا زمان استنتاج شناخته می‌شود. جاناتان فرانکل، دانشمند ارشد هوش مصنوعی Databricks، می‌گوید انتظار دارد این تکنیک در صنعت بسیار گسترده‌تر شود. علاوه بر ارائه پاسخ‌های بهتر، او می‌گوید، می‌تواند اقتصاد ساخت مدل‌های هوش مصنوعی را با جابجایی برخی هزینه‌ها از توسعه پیش از انتشار به زمان‌هایی که مدل‌ها در حال استفاده هستند و در نتیجه درآمدزایی می‌کنند، بهبود بخشد.

تفکر تکنولوژیکی مسئله گرسنگی روزافزون هوش مصنوعی برای داده‌ها را حل نمی‌کند. شرکت‌ها به طور فزاینده‌ای به داده‌های مصنوعی روی می‌آورند که می‌تواند اشکال مختلفی داشته باشد، از جمله متن‌های تولید شده توسط کامپیوتر که به منظور تقلید از محتوای ایجاد شده توسط افراد واقعی طراحی شده‌اند. ناتان لمبرت، دانشمند پژوهشی در موسسه Allen برای هوش مصنوعی، می‌گوید که هنگام توسعه مدلی به نام Tulu 3، او و همکارانش یک مدل هوش مصنوعی را برای تولید سوالات بر اساس شخصیت‌های خاص ترغیب کردند. به عنوان مثال، از آن می‌خواستند که وانمود کند یک فضانورد است و یک مسئله ریاضی خاص به آن شغل ایجاد کند، که در نتیجه سوالی درباره فاصله ماه از خورشید در یک زمان خاص از روز تولید می‌کرد. آنها سوالات را به مدل باز می‌گرداندند و سپس از هر دو سوال و پاسخ‌ها برای تنظیم دقیق سیستم خود استفاده می‌کردند. به دلایلی، این تکنیک توانایی‌های ریاضی Tulu 3 را بهبود بخشید. «ما نمی‌دانیم چرا کاملاً کار می‌کند»، لمبرت می‌گوید، «و این جنبه هیجان‌انگیز داده‌های مصنوعی است.»

Synthetic Data
تصویر: داده‌های مصنوعی

مدل‌های زبان بزرگ - نوعی از نرم‌افزار هوش مصنوعی که ChatGPT را قدرت می‌دهد - به منظور تکرار کلماتی که انسان‌ها برای ارتباط استفاده می‌کنند طراحی شده‌اند، بنابراین به سادگی آموزش یک سیستم هوش مصنوعی بر روی محتوایی که تولید می‌کند منجر به بهبود نخواهد شد، به گفته فرانکل. لمبرت می‌گوید مهم است که داده‌های تولید شده توسط هوش مصنوعی را فیلتر کنید تا از تکرار جلوگیری شود و صحت آن تأیید شود. برخی از محققان نیز نگرانی‌هایی را مطرح کرده‌اند که استفاده بی‌رویه از چنین داده‌هایی برای آموزش می‌تواند عملکرد مدل را مختل کند (پیامدی که به آن «فروپاشی مدل» می‌گویند).

فی‌فی لی، مدیر مشترک مؤسسه هوش مصنوعی انسان‌محور دانشگاه استنفورد و یکی از بنیان‌گذاران استارتاپ هوش مصنوعی World Labs، انتظار دارد شرکت‌های هوش مصنوعی به طور فزاینده‌ای به داده‌های مصنوعی متکی شوند. او اشاره کرد که کسانی که بر روی فناوری خودروهای خودران کار می‌کنند، برای مثال، مدت‌هاست که به داده‌های رانندگی شبیه‌سازی شده متکی هستند. «در پشته فناوری هوش مصنوعی، داده‌ها به اندازه الگوریتم‌ها مهم هستند»، لی می‌گوید. «داده‌های مصنوعی نقش بزرگی برای بازی دارند.»

مشکلات مقیاس‌گذاری مدل‌های عمومی بزرگ به ویژه اگر هدف کار به سمت AGI باشد، مرتبط هستند. اما به طور تاریخی، هوش مصنوعی به جای آن طراحی شده است که بر روی یک وظیفه واحد تمرکز کند و فرانکل از Databricks می‌گوید که فضای زیادی برای نوآوری در آنجا وجود دارد. به طور کلی، او خوش‌بین است. او آنچه در صنعت هوش مصنوعی در حال حاضر اتفاق می‌افتد را به آنچه در تکامل صنعت تراشه اتفاق افتاده است تشبیه می‌کند، جایی که توسعه‌دهندگان تراشه به چیزی که به نظر می‌رسید یک حد سخت است می‌رسیدند، سپس با نوآوری‌های مختلف - پردازنده‌های چند هسته‌ای، هم‌پردازنده‌ها، پردازش موازی - به بهبود فناوری ادامه می‌دادند.

«نگاه به روزهای نیمه‌رسانای ما»، او می‌گوید، «شما از یک نوآوری به نوآوری بعدی می‌روید و فقط به تلاش برای پیشرفت ادامه می‌دهید.»