IEEE Spectrum
IEEE Spectrum

۱۲ نمودار که وضعیت هوش مصنوعی در سال ۲۰۲۵ را توضیح می‌دهند

شاخص هوش مصنوعی استنفورد عملکرد، سرمایه‌گذاری، افکار عمومی و موارد دیگر را ردیابی می‌کند.

اگر اخبار مربوط به هوش مصنوعی را می‌خوانید، ممکن است با پیام‌های متناقض بمباران شوید: هوش مصنوعی در حال رونق است. هوش مصنوعی یک حباب است. تکنیک‌ها و معماری‌های فعلی هوش مصنوعی به تولید پیشرفت‌ها ادامه خواهند داد. هوش مصنوعی در مسیری ناپایدار قرار دارد و به ایده‌های جدید رادیکال نیاز دارد. هوش مصنوعی قرار است شغل شما را بگیرد. هوش مصنوعی بیشتر برای تبدیل عکس‌های خانوادگی شما به تصاویر متحرک به سبک استودیو گیبلی خوب است.

شاخص هوش مصنوعی ۲۰۲۵ از دانشگاه استنفورد، موسسه هوش مصنوعی انسان محور به رفع این سردرگمی کمک می‌کند. این گزارش ۴۰۰+ صفحه‌ای پر از نمودارها و داده‌ها در مورد موضوعات تحقیق و توسعه، عملکرد فنی، هوش مصنوعی مسئولانه، تأثیرات اقتصادی، علم و پزشکی، سیاست، آموزش و افکار عمومی است. همانطور که IEEE Spectrum هر سال انجام می‌دهد (پوشش ما را از ۲۰۲۱، ۲۰۲۲، ۲۰۲۳، و ۲۰۲۴ببینید)، ما کل گزارش را خوانده‌ایم و نمودارهایی را که فکر می‌کنیم داستان واقعی هوش مصنوعی را در حال حاضر بیان می‌کنند، انتخاب کرده‌ایم.

نمودار نشان‌دهنده روند مدل‌های برجسته هوش مصنوعی از سال ۲۰۰۳ تا ۲۰۲۴: ایالات متحده ۴۰، چین ۱۵، اروپا ۳ در سال ۲۰۲۴

۱. شرکت‌های آمریکایی جلوتر هستند

در حالی که راه‌های مختلفی برای اندازه‌گیری اینکه کدام کشور در مسابقه هوش مصنوعی "جلوتر" است وجود دارد (مقالات منتشر شده یا استناد شده، حق ثبت اختراع اعطا شده و غیره)، یک معیار ساده این است که چه کسی مدل‌هایی را ارائه می‌دهد که مهم هستند. موسسه تحقیقاتی Epoch AI دارای پایگاه داده‌ای از مدل‌های هوش مصنوعی مهم و تأثیرگذار است که از سال ۱۹۵۰ تا به امروز امتداد دارد، که شاخص هوش مصنوعی اطلاعات نشان داده شده در این نمودار را از آن استخراج کرده است.

سال گذشته، ۴۰ مدل قابل توجه از ایالات متحده آمده است، در حالی که چین ۱۵ مدل و اروپا ۳ مدل (به طور تصادفی، همه از فرانسه) داشته است. نمودار دیگری که در اینجا نشان داده نشده است، نشان می‌دهد که تقریباً تمام مدل‌های سال ۲۰۲۴ از صنعت به دست آمده‌اند تا از دانشگاه یا دولت. در مورد کاهش مدل‌های قابل توجه منتشر شده از سال ۲۰۲۳ به ۲۰۲۴، شاخص نشان می‌دهد که ممکن است به دلیل افزایش پیچیدگی فناوری و هزینه‌های رو به افزایش آموزش باشد.

نمودار میله‌ای نشان‌دهنده هزینه‌های آموزش هوش مصنوعی از سال ۲۰۱۷ تا ۲۰۲۴، با اوج ۱۹۱۹ میلیون دلار برای Gemini 1.0 Ultra

۲. صحبت از هزینه‌های آموزش...

وای، چقدر گران است! شاخص هوش مصنوعی داده‌های دقیقی ندارد، زیرا بسیاری از شرکت‌های پیشرو هوش مصنوعی انتشار اطلاعات در مورد اجرای آموزشی خود را متوقف کرده‌اند. اما محققان با Epoch AI همکاری کردند تا هزینه‌های حداقل برخی از مدل‌ها را بر اساس جزئیات به دست آمده در مورد مدت آموزش، نوع و مقدار سخت‌افزار و موارد مشابه تخمین بزنند. گران‌ترین مدلی که آنها توانستند هزینه‌ها را تخمین بزنند، Gemini 1.0 Ultra گوگل بود که هزینه‌ای نفس‌گیر حدود ۱۹۲ میلیون دلار آمریکا داشت. افزایش کلی در هزینه‌های آموزش همزمان با سایر یافته‌های گزارش بود: مدل‌ها نیز همچنان در تعداد پارامتر، زمان آموزش و میزان داده‌های آموزشی افزایش می‌یابند.

نمودار خطی نشان‌دهنده کاهش قیمت‌های استنتاج برای GPT-3.5 و GPT-4 در سراسر معیارها از سال ۲۰۲۲-۲۰۲۴

۳. با این حال هزینه استفاده از هوش مصنوعی در حال کاهش است

هزینه‌های رو به افزایش آموزش (بیشتر) مدل‌های هوش مصنوعی، خطرات پنهان کردن چند روند مثبت را که گزارش برجسته می‌کند، در پی دارد: هزینه‌های سخت‌افزار کاهش یافته است، عملکرد سخت‌افزار افزایش یافته است و بهره‌وری انرژی افزایش یافته است. این بدان معناست که هزینه‌های استنتاج، یا هزینه پرس و جو از یک مدل آموزش دیده، به طور چشمگیری کاهش می‌یابد. این نمودار که در مقیاس لگاریتمی است، روند را از نظر عملکرد هوش مصنوعی به ازای هر دلار نشان می‌دهد. در این گزارش آمده است که خط آبی نشان‌دهنده کاهش از ۲۰ دلار به ازای هر میلیون توکن به ۰٫۰۷ دلار به ازای هر میلیون توکن است. خط صورتی نشان‌دهنده کاهش از ۱۵ دلار به ۰٫۱۲ دلار در کمتر از یک سال است.

نمودار میله‌ای نشان‌دهنده افزایش انتشار کربن ناشی از آموزش مدل‌های هوش مصنوعی، ۲۰۱۲–۲۰۲۴

۴. ردپای کربنی عظیم هوش مصنوعی

در حالی که بهره‌وری انرژی یک روند مثبت است، بگذارید به یک روند منفی برگردیم: علی‌رغم دستاوردها در بهره‌وری، مصرف کلی برق افزایش یافته است، که به این معنی است که مراکز داده در مرکز رونق هوش مصنوعی، ردپای کربنی عظیمی دارند. شاخص هوش مصنوعی انتشار کربن مدل‌های هوش مصنوعی منتخب را بر اساس عواملی مانند سخت‌افزار آموزش، ارائه‌دهنده ابر و مکان تخمین زده است و دریافت که انتشار کربن ناشی از آموزش مدل‌های هوش مصنوعی پیشرفته به طور پیوسته در طول زمان افزایش یافته است—DeepSeek یک استثنا است.

امتیازات ربات چت ایالات متحده در مقابل چین: روند ایالات متحده از ۱۲۵۰ به ۱۳۸۵، چین از ۱۱۵۰ به ۱۳۶۲، ژانویه ۲۰۲۴-فوریه ۲۰۲۵

۵. شکاف عملکرد باریک‌تر می‌شود

ممکن است ایالات متحده همچنان رهبری قاطعی در کمیت مدل‌های قابل توجه منتشر شده داشته باشد، اما مدل‌های چینی از نظر کیفیت در حال رسیدن به آن هستند. این نمودار شکاف عملکرد باریک‌تر را در یک معیار ربات چت نشان می‌دهد. در ژانویه ۲۰۲۴، مدل برتر ایالات متحده ۹٫۲۶ درصد بهتر از بهترین مدل چینی عمل کرد. تا فوریه ۲۰۲۵، این شکاف به تنها ۱٫۷۰ درصد کاهش یافته بود. این گزارش نتایج مشابهی را در سایر معیارها مربوط به استدلال، ریاضیات و کدنویسی یافت.

نمودار میله‌ای نشان‌دهنده نرخ دقت مدل‌های مختلف هوش مصنوعی، با بالاترین میزان «o1» در ۸٫۸۰٪

۶. آخرین امتحان بشریت

گزارش امسال این واقعیت غیرقابل انکار را برجسته می‌کند که بسیاری از معیارهایی که ما برای سنجش قابلیت‌های سیستم‌های هوش مصنوعی استفاده می‌کنیم، "اشباع شده‌اند" - سیستم‌های هوش مصنوعی نمرات بسیار بالایی در معیارها دریافت می‌کنند که دیگر مفید نیستند. این اتفاق در بسیاری از حوزه‌ها افتاده است: دانش عمومی، استدلال در مورد تصاویر، ریاضیات، کدنویسی و غیره. گیل می‌گوید که با تعجب تماشا کرده است که معیار پس از معیار بی‌ربط شده‌اند. او می گوید: "من مدام فکر می کنم [عملکرد] به یک سطح می رسد، که به نقطه ای می رسد که ما به فناوری های جدید یا معماری های کاملاً متفاوت نیاز داریم" تا به پیشرفت ادامه دهیم. "اما اینطور نبوده است."

با توجه به این وضعیت، محققان مصمم در حال ساخت معیارهای جدیدی هستند که امیدوارند سیستم‌های هوش مصنوعی را به چالش بکشند. یکی از آنها آخرین امتحان بشریت است که از سوالات بسیار چالش برانگیزی تشکیل شده است که توسط کارشناسان موضوعی از ۵۰۰ موسسه در سراسر جهان ارائه شده است. تاکنون، حتی برای بهترین سیستم‌های هوش مصنوعی نیز سخت است: مدل استدلال OpenAI، o1، تاکنون با ۸٫۸ درصد پاسخ صحیح، بالاترین امتیاز را دارد. خواهیم دید که چه مدت طول می‌کشد.

نمودار میله‌ای نشان‌دهنده دسته‌های مختلف محدودیت‌های robots.txt در دامنه‌های برتر وب از سال ۲۰۱۶ تا ۲۰۲۴

۷. تهدیدی برای منابع اطلاعاتی مشترک

سیستم‌های هوش مصنوعی مولد امروزی با آموزش بر روی مقادیر زیادی داده که از اینترنت جمع‌آوری شده‌اند، هوشمند می‌شوند، که منجر به این ایده اغلب گفته شده می‌شود که "داده‌ها نفت جدید" اقتصاد هوش مصنوعی هستند. همانطور که شرکت‌های هوش مصنوعی به فشار دادن محدودیت‌های میزان داده‌ای که می‌توانند به مدل‌های خود وارد کنند ادامه می‌دهند، مردم نگران "اوج داده" شده‌اند و چه زمانی از این مواد تمام خواهیم شد. یکی از مسائل این است که وب‌سایت‌ها به طور فزاینده‌ای از خزیدن ربات‌ها در سایت‌های خود و جمع‌آوری داده‌های خود محدود می‌کنند (شاید به دلیل نگرانی از اینکه شرکت‌های هوش مصنوعی از داده‌های وب‌سایت‌ها سود می‌برند در حالی که همزمان مدل‌های تجاری خود را از بین می‌برند). وب‌سایت‌ها این محدودیت‌ها را در فایل‌های robots.txt قابل خواندن توسط ماشین اعلام می‌کنند.

این نمودار نشان می‌دهد که ۴۸ درصد از داده‌های دامنه‌های برتر وب اکنون کاملاً محدود شده‌اند. اما گیل می‌گوید که ممکن است رویکردهای جدید در هوش مصنوعی به وابستگی به مجموعه داده‌های عظیم پایان دهند. او می گوید: "من انتظار دارم که در مقطعی میزان داده به اندازه کافی حیاتی نباشد."

نمودار میله‌ای: روند سرمایه‌گذاری هوش مصنوعی بر اساس فعالیت (۲۰۱۳-۲۰۲۴). بالاترین: ۲۰۲۱ (۳۶۰٫۷۳ میلیارد دلار)، پایین‌ترین: ۲۰۱۳ (۱۴٫۵۷ میلیارد دلار)

۸. این پول شرکت‌هاست که می‌آید

دنیای شرکت‌ها در پنج سال گذشته شیرهای آب را برای تأمین مالی هوش مصنوعی باز کرده است. و در حالی که سرمایه‌گذاری کلی جهانی در سال ۲۰۲۴ با ارتفاعات سرمستانه سال ۲۰۲۱ مطابقت نداشت، قابل توجه است که سرمایه‌گذاری خصوصی هرگز بالاتر از این نبوده است. از ۱۵۰ میلیارد دلار سرمایه‌گذاری خصوصی در سال ۲۰۲۴، نمودار دیگری در شاخص (که در اینجا نشان داده نشده است) نشان می‌دهد که حدود ۳۳ میلیارد دلار به سرمایه‌گذاری در هوش مصنوعی مولد اختصاص یافته است.

تاثیر استفاده از هوش مصنوعی بر هزینه و درآمد بر اساس عملکرد (۲۰۲۴): بالاترین کاهش هزینه در عملیات خدمات، بالاترین افزایش درآمد در بازاریابی

۹. منتظر بازگشت سرمایه بزرگ

احتمالاً شرکت‌ها در هوش مصنوعی سرمایه‌گذاری می‌کنند زیرا انتظار بازگشت سرمایه بزرگ را دارند. این بخشی است که مردم با لحنی بی‌نفس در مورد ماهیت دگرگون‌کننده هوش مصنوعی و در مورد دستاوردهای بی‌سابقه‌ای در بهره‌وری صحبت می‌کنند. اما منصفانه است که بگوییم شرکت‌ها هنوز شاهد تحولی نبوده‌اند که منجر به صرفه‌جویی قابل توجه یا سودهای جدید قابل توجه شود. این نمودار با داده‌های برگرفته از نظرسنجی McKinsey نشان می‌دهد که از بین شرکت‌هایی که کاهش هزینه را گزارش کرده‌اند، بیشتر آنها کمتر از ۱۰ درصد صرفه‌جویی داشته‌اند. از شرکت‌هایی که افزایش درآمد ناشی از هوش مصنوعی داشته‌اند، بیشتر آنها افزایش کمتر از ۵ درصد را گزارش کرده‌اند. ممکن است این بازده بزرگ هنوز در راه باشد و ارقام سرمایه‌گذاری نشان می‌دهد که بسیاری از شرکت‌ها روی آن شرط‌بندی می‌کنند. فقط هنوز اینجا نیست.

نمودار جعبه‌ای نشان می‌دهد که GPT-4 به تنهایی در تشخیص بالینی در مقایسه با پزشکان + GPT-4 و پزشکان به تنهایی بالاترین امتیاز را کسب می‌کند

۱۰. دکتر هوش مصنوعی به زودی شما را خواهد دید، شاید

هوش مصنوعی برای علم و پزشکی یک رونق کوچک در رونق هوش مصنوعی است. این گزارش فهرستی از انواع جدید مدل‌های پایه ارائه شده است تا به محققان در زمینه‌هایی مانند علم مواد، پیش‌بینی آب و هوا و محاسبات کوانتومی کمک کند. بسیاری از شرکت‌ها در تلاشند تا قدرت‌های پیش‌بینی و مولد هوش مصنوعی را به کشف داروی سودآور تبدیل کنند. و مدل استدلال o1 OpenAI اخیراً در یک معیار به نام MedQA، که دارای سوالاتی از آزمون‌های هیئت پزشکی است، ۹۶ درصد امتیاز کسب کرده است.

اما به طور کلی، به نظر می‌رسد این یک منطقه با پتانسیل عظیم است که هنوز به تأثیر قابل توجهی در دنیای واقعی تبدیل نشده است - تا حدی، شاید، به این دلیل که انسان‌ها هنوز کاملاً متوجه نشده‌اند که چگونه از این فناوری استفاده کنند. این نمودار نتایج یک مطالعه در سال ۲۰۲۴ را نشان می‌دهد که آزمایش کرد که آیا پزشکان در صورت استفاده از GPT-4 علاوه بر منابع معمول خود، تشخیص دقیق‌تری خواهند داشت یا خیر. آنها این کار را نکردند و این کار آنها را سریع‌تر نکرد. در همین حال، GPT-4 به تنهایی هم از تیم‌های انسان-هوش مصنوعی و هم از انسان‌ها به تنهایی بهتر عمل کرد.

نمودار لایحه‌های پیشنهادی مرتبط با هوش مصنوعی در ایالات متحده که از ۰ به ۲۲۱ افزایش یافته است، ۲۰۱۶-۲۰۲۴. لوایح بسیار کمی تصویب شده است، از جمله تنها ۴ لایحه در سال ۲۰۲۴

۱۱. اقدام سیاستی ایالات متحده به ایالت‌ها منتقل می‌شود

در ایالات متحده، این نمودار نشان می‌دهد که صحبت‌های زیادی در مورد هوش مصنوعی در سالن‌های کنگره شده است و اقدام بسیار کمی صورت گرفته است. این گزارش خاطرنشان می‌کند که اقدام در ایالات متحده به سطح ایالتی منتقل شده است، جایی که ۱۳۱ لایحه در سال ۲۰۲۴ به قانون تبدیل شده است. از آن لوایح ایالتی، ۵۶ لایحه مربوط به دیپ‌فیک‌ها بود که یا استفاده از آنها را در انتخابات یا برای انتشار تصاویر صمیمی غیر توافقی ممنوع می‌کند.

فراتر از ایالات متحده، اروپا قانون هوش مصنوعی خود را تصویب کرد که تعهدات جدیدی را بر عهده شرکت‌هایی قرار می‌دهد که سیستم‌های هوش مصنوعی می‌سازند که پرخطر تلقی می‌شوند. اما روند بزرگ جهانی این بوده است که کشورها گرد هم می‌آیند تا اظهارات گسترده و غیرالزام‌آوری درباره نقشی که هوش مصنوعی باید در جهان ایفا کند، بیان کنند. بنابراین صحبت‌های زیادی در همه جا وجود دارد.

نمودار میله‌ای نشان‌دهنده نظرات در مورد تأثیر هوش مصنوعی بر مشاغل، احتمالاً تغییر عادات کاری بیشتر از جایگزینی مشاغل

۱۲. انسان‌ها خوش‌بین هستند

خواه شما یک عکاس سهام، یک مدیر بازاریابی یا یک راننده کامیون باشید، بحث‌های زیادی در مورد اینکه آیا هوش مصنوعی چه زمانی به سراغ شغل شما خواهد آمد یا خیر، وجود داشته است. اما در یک نظرسنجی جهانی اخیر در مورد نگرش‌ها نسبت به هوش مصنوعی، اکثریت مردم احساس تهدید از هوش مصنوعی نمی‌کردند. در حالی که ۶۰ درصد از پاسخ دهندگان از ۳۲ کشور معتقدند که هوش مصنوعی نحوه انجام مشاغل خود را تغییر خواهد داد، تنها ۳۶ درصد انتظار داشتند که جایگزین شوند. گیل می‌گوید: "من واقعاً از این نتایج نظرسنجی شگفت‌زده شدم. بسیار توانمند است که فکر کنیم، "هوش مصنوعی شغل من را تغییر خواهد داد، اما من همچنان ارزش خواهم داشت." منتظر بمانید تا متوجه شوید که آیا همه ما با مدیریت تیم‌های مشتاق کارمندان هوش مصنوعی ارزش ارائه می‌دهیم یا خیر.