اگر اخبار مربوط به هوش مصنوعی را میخوانید، ممکن است با پیامهای متناقض بمباران شوید: هوش مصنوعی در حال رونق است. هوش مصنوعی یک حباب است. تکنیکها و معماریهای فعلی هوش مصنوعی به تولید پیشرفتها ادامه خواهند داد. هوش مصنوعی در مسیری ناپایدار قرار دارد و به ایدههای جدید رادیکال نیاز دارد. هوش مصنوعی قرار است شغل شما را بگیرد. هوش مصنوعی بیشتر برای تبدیل عکسهای خانوادگی شما به تصاویر متحرک به سبک استودیو گیبلی خوب است.
شاخص هوش مصنوعی ۲۰۲۵ از دانشگاه استنفورد، موسسه هوش مصنوعی انسان محور به رفع این سردرگمی کمک میکند. این گزارش ۴۰۰+ صفحهای پر از نمودارها و دادهها در مورد موضوعات تحقیق و توسعه، عملکرد فنی، هوش مصنوعی مسئولانه، تأثیرات اقتصادی، علم و پزشکی، سیاست، آموزش و افکار عمومی است. همانطور که IEEE Spectrum هر سال انجام میدهد (پوشش ما را از ۲۰۲۱، ۲۰۲۲، ۲۰۲۳، و ۲۰۲۴ببینید)، ما کل گزارش را خواندهایم و نمودارهایی را که فکر میکنیم داستان واقعی هوش مصنوعی را در حال حاضر بیان میکنند، انتخاب کردهایم.
۱. شرکتهای آمریکایی جلوتر هستند
در حالی که راههای مختلفی برای اندازهگیری اینکه کدام کشور در مسابقه هوش مصنوعی "جلوتر" است وجود دارد (مقالات منتشر شده یا استناد شده، حق ثبت اختراع اعطا شده و غیره)، یک معیار ساده این است که چه کسی مدلهایی را ارائه میدهد که مهم هستند. موسسه تحقیقاتی Epoch AI دارای پایگاه دادهای از مدلهای هوش مصنوعی مهم و تأثیرگذار است که از سال ۱۹۵۰ تا به امروز امتداد دارد، که شاخص هوش مصنوعی اطلاعات نشان داده شده در این نمودار را از آن استخراج کرده است.
سال گذشته، ۴۰ مدل قابل توجه از ایالات متحده آمده است، در حالی که چین ۱۵ مدل و اروپا ۳ مدل (به طور تصادفی، همه از فرانسه) داشته است. نمودار دیگری که در اینجا نشان داده نشده است، نشان میدهد که تقریباً تمام مدلهای سال ۲۰۲۴ از صنعت به دست آمدهاند تا از دانشگاه یا دولت. در مورد کاهش مدلهای قابل توجه منتشر شده از سال ۲۰۲۳ به ۲۰۲۴، شاخص نشان میدهد که ممکن است به دلیل افزایش پیچیدگی فناوری و هزینههای رو به افزایش آموزش باشد.
۲. صحبت از هزینههای آموزش...
وای، چقدر گران است! شاخص هوش مصنوعی دادههای دقیقی ندارد، زیرا بسیاری از شرکتهای پیشرو هوش مصنوعی انتشار اطلاعات در مورد اجرای آموزشی خود را متوقف کردهاند. اما محققان با Epoch AI همکاری کردند تا هزینههای حداقل برخی از مدلها را بر اساس جزئیات به دست آمده در مورد مدت آموزش، نوع و مقدار سختافزار و موارد مشابه تخمین بزنند. گرانترین مدلی که آنها توانستند هزینهها را تخمین بزنند، Gemini 1.0 Ultra گوگل بود که هزینهای نفسگیر حدود ۱۹۲ میلیون دلار آمریکا داشت. افزایش کلی در هزینههای آموزش همزمان با سایر یافتههای گزارش بود: مدلها نیز همچنان در تعداد پارامتر، زمان آموزش و میزان دادههای آموزشی افزایش مییابند.
۳. با این حال هزینه استفاده از هوش مصنوعی در حال کاهش است
هزینههای رو به افزایش آموزش (بیشتر) مدلهای هوش مصنوعی، خطرات پنهان کردن چند روند مثبت را که گزارش برجسته میکند، در پی دارد: هزینههای سختافزار کاهش یافته است، عملکرد سختافزار افزایش یافته است و بهرهوری انرژی افزایش یافته است. این بدان معناست که هزینههای استنتاج، یا هزینه پرس و جو از یک مدل آموزش دیده، به طور چشمگیری کاهش مییابد. این نمودار که در مقیاس لگاریتمی است، روند را از نظر عملکرد هوش مصنوعی به ازای هر دلار نشان میدهد. در این گزارش آمده است که خط آبی نشاندهنده کاهش از ۲۰ دلار به ازای هر میلیون توکن به ۰٫۰۷ دلار به ازای هر میلیون توکن است. خط صورتی نشاندهنده کاهش از ۱۵ دلار به ۰٫۱۲ دلار در کمتر از یک سال است.
۴. ردپای کربنی عظیم هوش مصنوعی
در حالی که بهرهوری انرژی یک روند مثبت است، بگذارید به یک روند منفی برگردیم: علیرغم دستاوردها در بهرهوری، مصرف کلی برق افزایش یافته است، که به این معنی است که مراکز داده در مرکز رونق هوش مصنوعی، ردپای کربنی عظیمی دارند. شاخص هوش مصنوعی انتشار کربن مدلهای هوش مصنوعی منتخب را بر اساس عواملی مانند سختافزار آموزش، ارائهدهنده ابر و مکان تخمین زده است و دریافت که انتشار کربن ناشی از آموزش مدلهای هوش مصنوعی پیشرفته به طور پیوسته در طول زمان افزایش یافته است—DeepSeek یک استثنا است.
۵. شکاف عملکرد باریکتر میشود
ممکن است ایالات متحده همچنان رهبری قاطعی در کمیت مدلهای قابل توجه منتشر شده داشته باشد، اما مدلهای چینی از نظر کیفیت در حال رسیدن به آن هستند. این نمودار شکاف عملکرد باریکتر را در یک معیار ربات چت نشان میدهد. در ژانویه ۲۰۲۴، مدل برتر ایالات متحده ۹٫۲۶ درصد بهتر از بهترین مدل چینی عمل کرد. تا فوریه ۲۰۲۵، این شکاف به تنها ۱٫۷۰ درصد کاهش یافته بود. این گزارش نتایج مشابهی را در سایر معیارها مربوط به استدلال، ریاضیات و کدنویسی یافت.
۶. آخرین امتحان بشریت
گزارش امسال این واقعیت غیرقابل انکار را برجسته میکند که بسیاری از معیارهایی که ما برای سنجش قابلیتهای سیستمهای هوش مصنوعی استفاده میکنیم، "اشباع شدهاند" - سیستمهای هوش مصنوعی نمرات بسیار بالایی در معیارها دریافت میکنند که دیگر مفید نیستند. این اتفاق در بسیاری از حوزهها افتاده است: دانش عمومی، استدلال در مورد تصاویر، ریاضیات، کدنویسی و غیره. گیل میگوید که با تعجب تماشا کرده است که معیار پس از معیار بیربط شدهاند. او می گوید: "من مدام فکر می کنم [عملکرد] به یک سطح می رسد، که به نقطه ای می رسد که ما به فناوری های جدید یا معماری های کاملاً متفاوت نیاز داریم" تا به پیشرفت ادامه دهیم. "اما اینطور نبوده است."
با توجه به این وضعیت، محققان مصمم در حال ساخت معیارهای جدیدی هستند که امیدوارند سیستمهای هوش مصنوعی را به چالش بکشند. یکی از آنها آخرین امتحان بشریت است که از سوالات بسیار چالش برانگیزی تشکیل شده است که توسط کارشناسان موضوعی از ۵۰۰ موسسه در سراسر جهان ارائه شده است. تاکنون، حتی برای بهترین سیستمهای هوش مصنوعی نیز سخت است: مدل استدلال OpenAI، o1، تاکنون با ۸٫۸ درصد پاسخ صحیح، بالاترین امتیاز را دارد. خواهیم دید که چه مدت طول میکشد.
۷. تهدیدی برای منابع اطلاعاتی مشترک
سیستمهای هوش مصنوعی مولد امروزی با آموزش بر روی مقادیر زیادی داده که از اینترنت جمعآوری شدهاند، هوشمند میشوند، که منجر به این ایده اغلب گفته شده میشود که "دادهها نفت جدید" اقتصاد هوش مصنوعی هستند. همانطور که شرکتهای هوش مصنوعی به فشار دادن محدودیتهای میزان دادهای که میتوانند به مدلهای خود وارد کنند ادامه میدهند، مردم نگران "اوج داده" شدهاند و چه زمانی از این مواد تمام خواهیم شد. یکی از مسائل این است که وبسایتها به طور فزایندهای از خزیدن رباتها در سایتهای خود و جمعآوری دادههای خود محدود میکنند (شاید به دلیل نگرانی از اینکه شرکتهای هوش مصنوعی از دادههای وبسایتها سود میبرند در حالی که همزمان مدلهای تجاری خود را از بین میبرند). وبسایتها این محدودیتها را در فایلهای robots.txt قابل خواندن توسط ماشین اعلام میکنند.
این نمودار نشان میدهد که ۴۸ درصد از دادههای دامنههای برتر وب اکنون کاملاً محدود شدهاند. اما گیل میگوید که ممکن است رویکردهای جدید در هوش مصنوعی به وابستگی به مجموعه دادههای عظیم پایان دهند. او می گوید: "من انتظار دارم که در مقطعی میزان داده به اندازه کافی حیاتی نباشد."
۸. این پول شرکتهاست که میآید
دنیای شرکتها در پنج سال گذشته شیرهای آب را برای تأمین مالی هوش مصنوعی باز کرده است. و در حالی که سرمایهگذاری کلی جهانی در سال ۲۰۲۴ با ارتفاعات سرمستانه سال ۲۰۲۱ مطابقت نداشت، قابل توجه است که سرمایهگذاری خصوصی هرگز بالاتر از این نبوده است. از ۱۵۰ میلیارد دلار سرمایهگذاری خصوصی در سال ۲۰۲۴، نمودار دیگری در شاخص (که در اینجا نشان داده نشده است) نشان میدهد که حدود ۳۳ میلیارد دلار به سرمایهگذاری در هوش مصنوعی مولد اختصاص یافته است.
۹. منتظر بازگشت سرمایه بزرگ
احتمالاً شرکتها در هوش مصنوعی سرمایهگذاری میکنند زیرا انتظار بازگشت سرمایه بزرگ را دارند. این بخشی است که مردم با لحنی بینفس در مورد ماهیت دگرگونکننده هوش مصنوعی و در مورد دستاوردهای بیسابقهای در بهرهوری صحبت میکنند. اما منصفانه است که بگوییم شرکتها هنوز شاهد تحولی نبودهاند که منجر به صرفهجویی قابل توجه یا سودهای جدید قابل توجه شود. این نمودار با دادههای برگرفته از نظرسنجی McKinsey نشان میدهد که از بین شرکتهایی که کاهش هزینه را گزارش کردهاند، بیشتر آنها کمتر از ۱۰ درصد صرفهجویی داشتهاند. از شرکتهایی که افزایش درآمد ناشی از هوش مصنوعی داشتهاند، بیشتر آنها افزایش کمتر از ۵ درصد را گزارش کردهاند. ممکن است این بازده بزرگ هنوز در راه باشد و ارقام سرمایهگذاری نشان میدهد که بسیاری از شرکتها روی آن شرطبندی میکنند. فقط هنوز اینجا نیست.
۱۰. دکتر هوش مصنوعی به زودی شما را خواهد دید، شاید
هوش مصنوعی برای علم و پزشکی یک رونق کوچک در رونق هوش مصنوعی است. این گزارش فهرستی از انواع جدید مدلهای پایه ارائه شده است تا به محققان در زمینههایی مانند علم مواد، پیشبینی آب و هوا و محاسبات کوانتومی کمک کند. بسیاری از شرکتها در تلاشند تا قدرتهای پیشبینی و مولد هوش مصنوعی را به کشف داروی سودآور تبدیل کنند. و مدل استدلال o1 OpenAI اخیراً در یک معیار به نام MedQA، که دارای سوالاتی از آزمونهای هیئت پزشکی است، ۹۶ درصد امتیاز کسب کرده است.
اما به طور کلی، به نظر میرسد این یک منطقه با پتانسیل عظیم است که هنوز به تأثیر قابل توجهی در دنیای واقعی تبدیل نشده است - تا حدی، شاید، به این دلیل که انسانها هنوز کاملاً متوجه نشدهاند که چگونه از این فناوری استفاده کنند. این نمودار نتایج یک مطالعه در سال ۲۰۲۴ را نشان میدهد که آزمایش کرد که آیا پزشکان در صورت استفاده از GPT-4 علاوه بر منابع معمول خود، تشخیص دقیقتری خواهند داشت یا خیر. آنها این کار را نکردند و این کار آنها را سریعتر نکرد. در همین حال، GPT-4 به تنهایی هم از تیمهای انسان-هوش مصنوعی و هم از انسانها به تنهایی بهتر عمل کرد.
۱۱. اقدام سیاستی ایالات متحده به ایالتها منتقل میشود
در ایالات متحده، این نمودار نشان میدهد که صحبتهای زیادی در مورد هوش مصنوعی در سالنهای کنگره شده است و اقدام بسیار کمی صورت گرفته است. این گزارش خاطرنشان میکند که اقدام در ایالات متحده به سطح ایالتی منتقل شده است، جایی که ۱۳۱ لایحه در سال ۲۰۲۴ به قانون تبدیل شده است. از آن لوایح ایالتی، ۵۶ لایحه مربوط به دیپفیکها بود که یا استفاده از آنها را در انتخابات یا برای انتشار تصاویر صمیمی غیر توافقی ممنوع میکند.
فراتر از ایالات متحده، اروپا قانون هوش مصنوعی خود را تصویب کرد که تعهدات جدیدی را بر عهده شرکتهایی قرار میدهد که سیستمهای هوش مصنوعی میسازند که پرخطر تلقی میشوند. اما روند بزرگ جهانی این بوده است که کشورها گرد هم میآیند تا اظهارات گسترده و غیرالزامآوری درباره نقشی که هوش مصنوعی باید در جهان ایفا کند، بیان کنند. بنابراین صحبتهای زیادی در همه جا وجود دارد.
۱۲. انسانها خوشبین هستند
خواه شما یک عکاس سهام، یک مدیر بازاریابی یا یک راننده کامیون باشید، بحثهای زیادی در مورد اینکه آیا هوش مصنوعی چه زمانی به سراغ شغل شما خواهد آمد یا خیر، وجود داشته است. اما در یک نظرسنجی جهانی اخیر در مورد نگرشها نسبت به هوش مصنوعی، اکثریت مردم احساس تهدید از هوش مصنوعی نمیکردند. در حالی که ۶۰ درصد از پاسخ دهندگان از ۳۲ کشور معتقدند که هوش مصنوعی نحوه انجام مشاغل خود را تغییر خواهد داد، تنها ۳۶ درصد انتظار داشتند که جایگزین شوند. گیل میگوید: "من واقعاً از این نتایج نظرسنجی شگفتزده شدم. بسیار توانمند است که فکر کنیم، "هوش مصنوعی شغل من را تغییر خواهد داد، اما من همچنان ارزش خواهم داشت." منتظر بمانید تا متوجه شوید که آیا همه ما با مدیریت تیمهای مشتاق کارمندان هوش مصنوعی ارزش ارائه میدهیم یا خیر.