رز یو در حال نگاه کردن به ساحل لا جولا در دانشگاه کالیفرنیا، سن دیگو، شبکه های عصبی را می سازد که از
 اصول فیزیک برای حل مسائل عملی استفاده می کنند. عکس از پگی پیتی برای مجله کوانتا.
رز یو در حال نگاه کردن به ساحل لا جولا در دانشگاه کالیفرنیا، سن دیگو، شبکه های عصبی را می سازد که از اصول فیزیک برای حل مسائل عملی استفاده می کنند. عکس از پگی پیتی برای مجله کوانتا.

بهبود یادگیری عمیق با کمک اندکی از فیزیک

مقدمه

زمانی که رز یو ده ساله بود، هدیه تولدی دریافت کرد که زندگی او را تغییر داد - و به طور بالقوه، روش مطالعه ما در فیزیک را نیز. عمویش یک کامپیوتر برای او خرید. این یک کالای کمیاب در چین در ۲۵ سال پیش بود، و این هدیه بدون استفاده نماند. در ابتدا، یو عمدتاً بازی های کامپیوتری انجام می داد، اما در مدرسه راهنمایی، او جایزه ای برای طراحی وب دریافت کرد. این اولین افتخار از بسیاری افتخارات مربوط به کامپیوتر بود.

یو در دانشگاه ژجیانگ در رشته علوم کامپیوتر تحصیل کرد، جایی که جایزه ای برای تحقیقات نوآورانه دریافت کرد. برای تحصیلات تکمیلی، او دانشگاه کالیفرنیای جنوبی (USC) را انتخاب کرد، تا حدی به این دلیل که همان عمو - که تنها کسی بود که در ایالات متحده می شناخت - در آن زمان در آزمایشگاه پیشرانه جت در نزدیکی پاسادنا کار می کرد. یو دکترای خود را در سال ۲۰۱۷ با جایزه بهترین پایان نامه دریافت کرد. آخرین افتخار او در ژانویه به دست آمد، زمانی که رئیس جمهور جو بایدن، در آخرین هفته حضور خود در دفتر، جایزه شغلی زودهنگام ریاست جمهوری را به او اهدا کرد.

یو، که اکنون دانشیار دانشگاه کالیفرنیا، سن دیگو (UCSD) است، یک رهبر در زمینه ای است که به عنوان "یادگیری عمیق هدایت شده توسط فیزیک" شناخته می شود، و سال ها دانش خود را از فیزیک در شبکه های عصبی مصنوعی گنجانده است. این کار نه تنها تکنیک های جدیدی برای ساخت و آموزش این سیستم ها معرفی کرده است، بلکه به او اجازه داده است تا در چندین برنامه کاربردی دنیای واقعی پیشرفت کند. او از اصول دینامیک سیالات برای بهبود پیش بینی های ترافیک، سرعت بخشیدن به شبیه سازی های آشفتگی برای افزایش درک ما از طوفان ها و ابداع ابزارهایی که به پیش بینی گسترش کووید-۱۹ کمک می کند، استفاده کرده است.

این کار یو را به رویای بزرگ خود نزدیک تر کرده است - استقرار مجموعه ای از دستیاران آزمایشگاهی دیجیتال که او آن را دانشمند هوش مصنوعی می نامد. او اکنون آنچه را که "مشارکت" بین محققان انسانی و ابزارهای هوش مصنوعی می نامد، به طور کامل بر اساس اصول فیزیک تصور می کند و بنابراین قادر به ارائه بینش های علمی جدید است. به عقیده او، ترکیب ورودی ها از یک تیم از چنین دستیارانی ممکن است بهترین راه برای تقویت فرآیند کشف باشد.

کوانتا با یو درباره آشفتگی در شکل های مختلف آن، نحوه استفاده بیشتر از هوش مصنوعی و چگونگی نجات ما از ترافیک شهری صحبت کرد. این مصاحبه برای وضوح بیشتر خلاصه و ویرایش شده است.

این با ترافیک شروع شد. من دانشجوی فارغ التحصیل در USC بودم، و پردیس درست در نزدیکی تقاطع I-10 و I-110 قرار دارد. برای رفتن به هر جایی، باید از ترافیک زیادی عبور کنید، که می تواند بسیار آزاردهنده باشد. در سال ۲۰۱۶، شروع به این کردم که آیا می توانم کاری در این مورد انجام دهم یا خیر.

یادگیری عمیق - که از شبکه های عصبی چند لایه برای استخراج الگوها از داده ها استفاده می کند - در آن زمان واقعاً داغ شده بود. در حال حاضر هیجان زیادی در مورد برنامه های کاربردی در طبقه بندی تصویر وجود داشت، اما تصاویر فقط چیزهای ایستا هستند. من تعجب می کردم که آیا یادگیری عمیق می تواند به حل مشکلاتی کمک کند که در آن ها چیزها دائماً در حال تغییر هستند. من اولین کسی نبودم که به این موضوع فکر می کردم، اما همکارانم و من راه جدیدی برای چارچوب بندی مسئله پیدا کردیم.

اول، ما به ترافیک از نظر فرآیند فیزیکی انتشار فکر کردیم. در مدل ما، جریان ترافیک بر روی یک شبکه از جاده ها مشابه جریان سیالات بر روی یک سطح است - حرکاتی که توسط قوانین دینامیک سیالات اداره می شوند. اما نوآوری اصلی ما این بود که ترافیک را به عنوان یک گراف در نظر بگیریم، از حوزه ریاضی نظریه گراف. حسگرها، که ترافیک را در بزرگراه ها و جاده های دیگر نظارت می کنند، به عنوان گره های این گراف عمل می کنند. و لبه های گراف نشان دهنده جاده ها (و فاصله ها) بین آن حسگرها هستند.

یک گراف یک عکس فوری از کل شبکه جاده ای در یک زمان معین ارائه می دهد و سرعت متوسط خودروها را در هر نقطه از گراف به شما می گوید. هنگامی که یک سری از این عکس های فوری را که با فاصله هر پنج دقیقه از هم قرار گرفته اند، کنار هم قرار می دهید، تصویر خوبی از نحوه تکامل ترافیک به دست می آورید. از آنجا، می توانید سعی کنید پیش بینی کنید که در آینده چه اتفاقی خواهد افتاد.

چالش بزرگ در یادگیری عمیق این است که شما به داده های زیادی برای آموزش شبکه عصبی نیاز دارید. خوشبختانه، یکی از مشاوران من، سیروس شهابی، سال ها روی مسئله پیش بینی ترافیک کار کرده بود، و او مقدار زیادی داده ترافیک لس آنجلس را جمع آوری کرده بود که من به آن دسترسی داشتم.

قبل از کار ما، مردم فقط می توانستند پیش بینی های ترافیکی را انجام دهند که حدود ۱۵ دقیقه قابل اعتماد بودند. پیش بینی های ما برای یک ساعت معتبر بود - یک پیشرفت بزرگ. کد ما در سال ۲۰۱۸ توسط Google Maps مستقر شد. کمی بعد، گوگل از من دعوت کرد تا به عنوان یک محقق مهمان به آنجا بروم.

بله، این در سال ۲۰۱۸ شروع شد، زمانی که من در آزمایشگاه ملی لارنس برکلی سخنرانی کردم. پس از آن، با دانشمندان آنجا صحبت کردم، و ما به دنبال مشکلی بودیم که یک بستر آزمایشی خوب برای یادگیری عمیق هدایت شده توسط فیزیک باشد. ما تصمیم گرفتیم تکامل جریان آشفته را پیش بینی کنیم، که یک عامل کلیدی در مدل های آب و هوایی و همچنین یک منطقه عدم قطعیت عمده است.

نمونه های آشنای آشفتگی، الگوهای چرخشی هستند که پس از ریختن شیر در یک فنجان قهوه و هم زدن آن می بینید. در اقیانوس ها، چنین چرخش هایی می تواند هزاران مایل را در بر گیرد. پیش بینی های رفتار آشفته که بر اساس حل معادله ناویر-استوکس (Navier-Stokes equation) است، که جریان سیالات را توصیف می کند، به عنوان استاندارد طلایی در این زمینه در نظر گرفته می شود. اما محاسبات مورد نیاز بسیار کند است، به همین دلیل است که ما مدل های خوبی برای پیش بینی طوفان ها و سیکلون های گرمسیری نداریم.

ایده اصلی این است که شبکه های عصبی عمیق که بر روی بهترین شبیه سازی های عددی ما آموزش داده شده اند، می توانند تقلید - یا همانطور که می گوییم، "شبیه سازی" - آن شبیه سازی ها را یاد بگیرند. آنها این کار را با تشخیص خواص و الگوهای دفن شده در داده ها انجام می دهند. آنها مجبور نیستند برای یافتن راه حل های تقریبی، محاسبات وقت گیر و اجباری را انجام دهند. مدل های ما پیش بینی ها را با ضریب ۲۰ در تنظیمات دو بعدی و با ضریب ۱۰۰۰ در تنظیمات سه بعدی سرعت بخشیدند. چیزی شبیه به ماژول پیش بینی آشفتگی ما ممکن است روزی در مدل های آب و هوایی بزرگتر قرار گیرد که می توانند در پیش بینی چیزهایی مانند طوفان ها بهتر عمل کنند.

تقریباً همه جا وجود دارد. به عنوان مثال، آشفتگی در جریان خون می تواند منجر به سکته مغزی یا حملات قلبی شود. و زمانی که من در Caltech [موسسه فناوری کالیفرنیا] یک پست دکترا بودم، در یک مقاله که به بررسی تثبیت پهپادها می پرداخت، شرکت کردم. جریان های هوای تولید شده توسط پروانه با زمین تعامل می کنند تا آشفتگی ایجاد کنند. این به نوبه خود می تواند باعث لرزش پهپاد شود. ما از یک شبکه عصبی برای مدل سازی آشفتگی استفاده کردیم، و این منجر به کنترل بهتر پهپادها در هنگام برخاستن و فرود شد.

من در حال حاضر با دانشمندان UCSD و General Atomics در مورد انرژی همجوشی کار می کنم. یکی از کلیدهای موفقیت یادگیری نحوه کنترل پلاسما است که یک فاز داغ و یونیزه شده ماده است. در دماهای حدود ۱۰۰ میلیون درجه، انواع مختلفی از آشفتگی در داخل پلاسما ایجاد می شود، و مدل های عددی مبتنی بر فیزیک که این رفتار را توصیف می کنند بسیار کند هستند. ما در حال توسعه یک مدل یادگیری عمیق هستیم که باید بتواند رفتار پلاسما را در یک صدم ثانیه پیش بینی کند، اما این هنوز یک کار در حال انجام است.

در چند سال گذشته، گروه من الگوریتم های هوش مصنوعی را توسعه داده اند که می توانند به طور خودکار اصول تقارن را از داده ها کشف کنند. به عنوان مثال، الگوریتم ما تقارن لورنتس (Lorentz symmetry) را شناسایی کرد، که مربوط به ثابت بودن سرعت نور است. الگوریتم ما همچنین تقارن چرخشی را شناسایی کرد - به عنوان مثال، این واقعیت که یک کره بدون توجه به نحوه چرخاندن آن، متفاوت به نظر نمی رسد - که چیزی است که به طور خاص برای دانستن آن آموزش ندیده بود. در حالی که این خواص شناخته شده هستند، ابزارهای ما همچنین توانایی کشف تقارن های جدیدی را دارند که در حال حاضر برای فیزیک ناشناخته هستند، که یک پیشرفت بزرگ خواهد بود.

سپس به این نتیجه رسیدم که اگر ابزارهای ما می توانند تقارن ها را از داده های خام کشف کنند، چرا سعی نمی کنیم این را تعمیم دهیم؟ این ابزارها همچنین می توانند ایده های تحقیقاتی یا فرضیه های جدید در علم ایجاد کنند. این پیدایش دانشمند هوش مصنوعی بود.

این یک شبکه عصبی واحد نیست، بلکه مجموعه ای از برنامه های کامپیوتری است که می توانند به دانشمندان در کشف های جدید کمک کنند. گروه من در حال حاضر الگوریتم هایی را توسعه داده اند که می توانند به وظایف فردی مانند پیش بینی آب و هوا، شناسایی عوامل افزایش دمای جهانی یا تلاش برای کشف روابط علّی مانند اثرات سیاست های واکسیناسیون بر انتقال بیماری کمک کنند.

ما اکنون در حال ساخت یک مدل "بنیاد" گسترده تر هستیم که به اندازه کافی همه کاره باشد تا بتواند چندین کار را انجام دهد. دانشمندان داده ها را از انواع ابزارها جمع آوری می کنند، و ما می خواهیم مدل ما شامل انواع داده ها - اعداد، متن، تصاویر و فیلم ها - باشد. ما یک نمونه اولیه اولیه داریم، اما می خواهیم قبل از انتشار آن، مدل خود را جامع تر، هوشمندتر و بهتر آموزش دهیم. این می تواند ظرف چند سال اتفاق بیفتد.

هوش مصنوعی می تواند تقریباً در هر مرحله از فرآیند کشف علمی کمک کند. وقتی می گویم "دانشمند هوش مصنوعی"، منظورم واقعاً یک دستیار علمی هوش مصنوعی است. به عنوان مثال، مرحله بررسی ادبیات در یک آزمایش معمولاً به یک تلاش گسترده جمع آوری و سازماندهی داده ها نیاز دارد. اما اکنون، یک مدل زبانی بزرگ می تواند هزاران کتاب را در یک استراحت ناهار بخواند و خلاصه کند. چیزی که هوش مصنوعی در آن خوب نیست، قضاوت در مورد اعتبار علمی است. در این مورد، نمی تواند با یک محقق با تجربه رقابت کند. در حالی که هوش مصنوعی می تواند در تولید فرضیه، طراحی آزمایش ها و تجزیه و تحلیل داده ها کمک کند، اما هنوز نمی تواند آزمایش های پیچیده را انجام دهد.

همانطور که من تصور می کنم، یک دانشمند هوش مصنوعی می تواند محققان را از برخی کارهای طاقت فرسا رها کند در حالی که به مردم اجازه می دهد جنبه های خلاقانه علم را انجام دهند. این چیزی است که ما به ویژه در آن خوب هستیم. مطمئن باشید، هدف جایگزینی دانشمندان انسانی نیست. من جانشینی یک ماشین یا مداخله در خلاقیت انسان را تصور نمی کنم - و هرگز نمی خواهم ببینم.