نویسنده یک کیهانشناس نظری در دانشگاه کمبریج و مدیر مرکز هوش مصنوعی اینفوسیس-کمبریج است.
زمانی تصور میشد که ریاضیات از هجوم قریبالوقوع خودکارسازی هوش مصنوعی نسبتاً در امان است. چتباتها ممکن است بتوانند متن، کد و تصاویر را بر اساس تقاضا تولید کنند، اما استدلال عمیقی که برای ریاضیات لازم است، ظاهراً از دسترس خارج بود. بنابراین، مدالهای طلایی که اخیراً OpenAI و DeepMind در المپیاد جهانی ریاضی به دست آوردند، باعث شده است که استادان ریاضی مانند من ناگهان احساس امنیت کمتری داشته باشند.
آیا هوش مصنوعی قرار است با اثباتهای ریاضی همان کاری را کند که در حال حاضر با برنامهنویسی میکند؟ به هر حال، این دو شباهتهای واضحی دارند: هر دو «زبانهایی» بسیار ساختاریافته با قواعد روشن و «واژهنامههای» محدود هستند. هر دو دارای مجموعههای بزرگی از مثالها هستند که هوش مصنوعی میتواند با راهحلهای شناخته شده بر روی آنها آموزش ببیند.
با این حال، در حالی که نتایج مدلهای پیشرفته ریاضی هوش مصنوعی چشمگیر هستند، نوع دیگری از ریاضیات وجود دارد که هوش مصنوعی مولد هنوز با آن دست و پنجه نرم میکند: محاسبات ساده. بپرسید «۵.۱۱ منهای ۵.۹ چند میشود؟» و پاسخها متفاوت است. امروز صبح، جدیدترین مدل GPT5 شرکت OpenAI پاسخ صحیح -۰.۷۹ را به من داد. اما اگر سؤال را به عنوان بخشی از یک محاسبه بیان کنید، ممکن است پاسخ متفاوتی دریافت کنید.
از مدلهای هوش مصنوعی که میتوانند بهتر از شرکتکنندگان المپیاد دبیرستان عمل کنند اما همیشه نمیتوانند در سطح دبستان جمع یا تفریق انجام دهند، چه باید درک کرد؟ برای درک این موضوع، مفید است که به این فکر کنیم که در ریاضیات خوب بودن به چه معناست.
روش آموزش ریاضیات این است که به دانشآموزان یک مسئله نشان داده میشود، روش حل آن را توضیح میدهند و سپس مثالهایی برای حل میدهند. دانشآموزان ضعیفتر به مثالهای متعدد نیاز دارند و گاهی اوقات تنها روش را بدون درک آن حفظ میکنند. قویترین دانشآموزان تنها به یک یا دو مثال برای تسلط بر مفهوم و به کارگیری آن در مسائل جدید نیاز دارند.
توانایی مفهومسازی و تعمیم، بهترین ریاضیدانان را متمایز میکند. ریاضیدانان خوب مسائل دشوار را حل میکنند؛ افراد بزرگ راههایی برای آسان کردن مسائل دشوار پیدا میکنند.
نقاط قوت مدلهای هوش مصنوعی در سرعت و توانایی آنها برای «تمرین» در حجم بسیار بالا نهفته است. این بدان معناست که آنها میتوانند مسائل بسیار دشواری را حل کنند که شباهتهایی به چیزهایی که قبلاً دیدهاند دارند، اما ممکن است هنگام مواجهه با چیزی جدید دچار مشکل شوند. این به ویژه برای ریاضیات نظری یک مشکل است. هرچه به مسائل پیشرفتهتر نزدیکتر میشویم، تعداد مثالهای موجود برای آموزش کاهش مییابد.
اینها مسائل شناخته شدهای با شبکههای عصبی هستند. آنها در درونیابی (تولید پاسخهایی که «بین» چیزهایی هستند که قبلاً دیدهاند) عالی هستند و در برونیابی (تولید پاسخهایی که خارج از مجموعه آموزش آنها قرار میگیرند) ضعیفاند.
در ریاضیات، این موضوع به دلیل مسائلی که شبیه به هم به نظر میرسند، دشوارتر میشود. مثلاً: «حداکثر تعداد مکعبهایی با حجم ۱ که میتوانید در یک مکعب با حجم ۶۴ جای دهید چقدر است؟» و «حداکثر تعداد کرههایی با حجم ۱ که میتوانید در یک کره با حجم ۶۴ جای دهید چقدر است؟». آنها شبیه به هم به نظر میرسند اما یکی حل سادهای دارد (مکعبها به صورت یک بلوک ۴x۴x۴ به خوبی در کنار هم قرار میگیرند)، در حالی که دیگری بسیار پیچیده است (کرهها به خوبی روی هم قرار نمیگیرند).
این بدان معناست که استفاده از هوش مصنوعی در ریاضیات کاربردی و کیهانشناسی هنوز محدود است. ما میتوانیم کارهایی را که از قبل میدانیم چگونه انجام دهیم، انجام داده و از هوش مصنوعی برای خودکارسازی آنها استفاده کنیم. اما تا کنون، محاسبات پیشرفت چندانی نداشته است.
با این حال، ممکن است آموزش بیشتر، مشکل را بدون نیاز به برونیابی حل کند. اگر مدلهای هوش مصنوعی بتوانند به اندازه کافی محاسبات پیچیده را تغذیه شوند، شاید بتوانند مسائلی را حل کنند که تاکنون از دسترس ما خارج بودهاند، بدون نیاز به هیچ الهامبخشی در سطح انسانی.
سؤالی که در رشته من مطرح میشود این است: «یک ریاضیدان بسیار سریع، بسیار آموزشدیده و نااندیشمند چقدر قدرتمند است؟» ما در حال یافتن پاسخ آن هستیم.