غولهای هوش مصنوعی به دنبال تاکتیکهای جدید هستند حالا که «میوههای دمدست» تمام شدهاند
دو سال از زمانی که OpenAI با معرفی ChatGPT عصر هوش مصنوعی مولد را به اوج رساند، در یک چشم به هم زدن گذشت. OpenAI و رقبای اصلی آن، Anthropic، Google و Meta، مجموعهای از مدلهای پیشرفته هوش مصنوعی را منتشر کردهاند که هر کدام از دیگری ماهرتر است. اکنون دره سیلیکون معتقد است که قدرت محاسباتی بیشتر، دادههای بیشتر و مدلهای بزرگتر منجر به بهبودهای اساسی در هوش مصنوعی خواهد شد که این فناوری در چند سال آینده صنایع کامل را متحول خواهد کرد.
و با این حال، تهدیدهایی برای سرعت توسعه حتی قبل از دومین سالگرد ChatGPT ظاهر شدند. در سال ۲۰۲۴، OpenAI و دو شرکت پیشرو دیگر در هوش مصنوعی با موانعی روبرو شدند. در OpenAI و Google، برخی از نرمافزارها نتوانستند به انتظارات داخلی برسند، در حالی که جدول زمانی یک مدل مورد انتظار از Anthropic، که توسط کارکنان سابق OpenAI ساخته شده بود، پس از اعلام قبلی به تعویق افتاد. اگر پیشرفت در هوش مصنوعی مولد به طریقی پایدار کند شود، این سوال را به وجود خواهد آورد که آیا این فناوری میتواند به وعدههای گستردهتری که نوآوران برتر صنعت برای آن دادهاند، دست یابد یا خیر. شناسایی راههایی برای پیشبرد رونق هوش مصنوعی به مرحله بعدی آن، چالش اصلی این حوزه در سال ۲۰۲۵ خواهد بود.
شرکتها با چندین مانع روبرو هستند. یافتن منابع جدید دادههای آموزشی با کیفیت بالا و انسانی برای ساخت سیستمهای پیشرفتهتر هوش مصنوعی دشوارتر شده است. علاوه بر این، حتی بهبودهای جزئی در عملکرد هوش مصنوعی ممکن است برای توجیه هزینههای هنگفت مرتبط با ایجاد و بهرهبرداری از مدلهای جدید کافی نباشد. داریو آمودی، مدیرعامل Anthropic، گفته است که هزینه آموزش یک مدل پیشرفته حدود ۱۰۰ میلیون دلار است و انتظار دارد این مبلغ در سالهای آینده به ۱۰۰ میلیارد دلار برسد. سارا فرایر، مدیر مالی OpenAI، میگوید که میتوان گفت مدل پیشرفته بعدی شرکت میلیاردها دلار هزینه خواهد داشت و هنوز نیاز به مدلهای بزرگتر و گرانتر وجود دارد.
این مسائل تردیدهایی را درباره میلیاردها دلاری که قبلاً در هوش مصنوعی سرمایهگذاری شده و هدفی که این شرکتها به شدت دنبال میکنند - یعنی هوش مصنوعی عمومی یا AGI که میتواند در طیف گستردهای از وظایف با انسانها برابری یا برتری کند - به وجود میآورد. مدیران عامل OpenAI و Anthropic قبلاً گفتهاند که AGI ممکن است تنها چند سال فاصله داشته باشد و هر دو هرگونه پیشنهاد مبنی بر اینکه به دیوار برخورد کردهاند را رد کردهاند. با این حال، دیگر رهبران صنعت لحنی متواضعتر دارند. «فکر میکنم پیشرفت سختتر خواهد شد»، مدیرعامل Google، سوندار پیچای، در مصاحبهای در اجلاس DealBook نیویورک تایمز در اوایل دسامبر گفت. به سال ۲۰۲۵ نگاه میکنیم، او گفت: «میوههای دمدست تمام شدهاند، تپه شیبدارتر است.»
در صنعتی که به نوآوری افتخار میکند، شرکتها به دنبال راههای مختلفی برای پیشبرد مدلهای هوش مصنوعی هستند. تلاشهای در حال انجام شامل این است که کامپیوترها را به تقلید از نحوه تفکر انسانها درباره یک مشکل برای حل بهتر آن وادار کنند، مدلهایی بسازند که در انواع خاصی از وظایف واقعاً خوب باشند و هوش مصنوعی را با دادههایی که خود هوش مصنوعی تولید کرده است آموزش دهند.
به طور خاص، OpenAI از هوش مصنوعی که میتواند استدلال انسانی را برای پاسخ به سوالات پیچیدهتر و بهبود در طول زمان انجام دهد، حمایت اولیه کرده است، به ویژه در مورد سوالات مربوط به ریاضیات، علوم و کدنویسی. در سپتامبر، این شرکت نسخه اولیه یک مدل به نام o1 را معرفی کرد که این کار را با صرف زمان بیشتر برای محاسبه یک پاسخ قبل از پاسخ دادن به سوال کاربر انجام میدهد. OpenAI نسخه بهبود یافتهای از آن مدل را در دسامبر اعلام کرد که مدیرعامل سام آلتمن در شبکههای اجتماعی به آن به عنوان «باهوشترین مدل در جهان» اشاره کرد.
این شرکت به قدری به o1 اطمینان دارد که شروع به ارائه اشتراک ماهانه ۲۰۰ دلاری کرده است که شامل، در میان ویژگیهای دیگر، دسترسی به نسخهای از مدل است که میتواند از قدرت محاسباتی بیشتری برای پاسخ به سوالات استفاده کند.
چندین شرکت دیگر، از جمله Google و سازنده نرمافزار Databricks، در حال کار بر روی نسخههای خود از این رویکرد هستند که اغلب به عنوان محاسبات زمان آزمون یا زمان استنتاج شناخته میشود. جاناتان فرانکل، دانشمند ارشد هوش مصنوعی Databricks، میگوید انتظار دارد این تکنیک در صنعت بسیار گستردهتر شود. علاوه بر ارائه پاسخهای بهتر، او میگوید، میتواند اقتصاد ساخت مدلهای هوش مصنوعی را با جابجایی برخی هزینهها از توسعه پیش از انتشار به زمانهایی که مدلها در حال استفاده هستند و در نتیجه درآمدزایی میکنند، بهبود بخشد.
تفکر تکنولوژیکی مسئله گرسنگی روزافزون هوش مصنوعی برای دادهها را حل نمیکند. شرکتها به طور فزایندهای به دادههای مصنوعی روی میآورند که میتواند اشکال مختلفی داشته باشد، از جمله متنهای تولید شده توسط کامپیوتر که به منظور تقلید از محتوای ایجاد شده توسط افراد واقعی طراحی شدهاند. ناتان لمبرت، دانشمند پژوهشی در موسسه Allen برای هوش مصنوعی، میگوید که هنگام توسعه مدلی به نام Tulu 3، او و همکارانش یک مدل هوش مصنوعی را برای تولید سوالات بر اساس شخصیتهای خاص ترغیب کردند. به عنوان مثال، از آن میخواستند که وانمود کند یک فضانورد است و یک مسئله ریاضی خاص به آن شغل ایجاد کند، که در نتیجه سوالی درباره فاصله ماه از خورشید در یک زمان خاص از روز تولید میکرد. آنها سوالات را به مدل باز میگرداندند و سپس از هر دو سوال و پاسخها برای تنظیم دقیق سیستم خود استفاده میکردند. به دلایلی، این تکنیک تواناییهای ریاضی Tulu 3 را بهبود بخشید. «ما نمیدانیم چرا کاملاً کار میکند»، لمبرت میگوید، «و این جنبه هیجانانگیز دادههای مصنوعی است.»
مدلهای زبان بزرگ - نوعی از نرمافزار هوش مصنوعی که ChatGPT را قدرت میدهد - به منظور تکرار کلماتی که انسانها برای ارتباط استفاده میکنند طراحی شدهاند، بنابراین به سادگی آموزش یک سیستم هوش مصنوعی بر روی محتوایی که تولید میکند منجر به بهبود نخواهد شد، به گفته فرانکل. لمبرت میگوید مهم است که دادههای تولید شده توسط هوش مصنوعی را فیلتر کنید تا از تکرار جلوگیری شود و صحت آن تأیید شود. برخی از محققان نیز نگرانیهایی را مطرح کردهاند که استفاده بیرویه از چنین دادههایی برای آموزش میتواند عملکرد مدل را مختل کند (پیامدی که به آن «فروپاشی مدل» میگویند).
فیفی لی، مدیر مشترک مؤسسه هوش مصنوعی انسانمحور دانشگاه استنفورد و یکی از بنیانگذاران استارتاپ هوش مصنوعی World Labs، انتظار دارد شرکتهای هوش مصنوعی به طور فزایندهای به دادههای مصنوعی متکی شوند. او اشاره کرد که کسانی که بر روی فناوری خودروهای خودران کار میکنند، برای مثال، مدتهاست که به دادههای رانندگی شبیهسازی شده متکی هستند. «در پشته فناوری هوش مصنوعی، دادهها به اندازه الگوریتمها مهم هستند»، لی میگوید. «دادههای مصنوعی نقش بزرگی برای بازی دارند.»
مشکلات مقیاسگذاری مدلهای عمومی بزرگ به ویژه اگر هدف کار به سمت AGI باشد، مرتبط هستند. اما به طور تاریخی، هوش مصنوعی به جای آن طراحی شده است که بر روی یک وظیفه واحد تمرکز کند و فرانکل از Databricks میگوید که فضای زیادی برای نوآوری در آنجا وجود دارد. به طور کلی، او خوشبین است. او آنچه در صنعت هوش مصنوعی در حال حاضر اتفاق میافتد را به آنچه در تکامل صنعت تراشه اتفاق افتاده است تشبیه میکند، جایی که توسعهدهندگان تراشه به چیزی که به نظر میرسید یک حد سخت است میرسیدند، سپس با نوآوریهای مختلف - پردازندههای چند هستهای، همپردازندهها، پردازش موازی - به بهبود فناوری ادامه میدادند.
«نگاه به روزهای نیمهرسانای ما»، او میگوید، «شما از یک نوآوری به نوآوری بعدی میروید و فقط به تلاش برای پیشرفت ادامه میدهید.»