توسط تانیا پترسن
شارلوت بون، رئیس گروه هوش مصنوعی در پزشکی مولکولی EPFL، در حال توسعه الگوریتمهای هوش مصنوعی برای درک بهتر دادههای فوقالعاده پیچیده و با ابعاد بالا است که نشاندهنده صدها لایه بافتی و نشانگرهای پروتئینی در یک سلول منفرد است. مجله EPFL با عنوان Dimensions با شارلوت بون در مورد کارش در خط مقدم هوش مصنوعی در پزشکی و زیستشناسی صحبت کرد.
میتوانید تمرکز تحقیقات خود را شرح دهید؟
ما در حال توسعه ابزارهای تشخیصی برای کلینیکها هستیم که توسط فناوریهای هوش مصنوعی هدایت میشوند. این شامل پیشبینی بهترین درمانی است که یک بیمار باید دریافت کند، تلاش برای درک وضعیت بیماری که بیمار در آن قرار دارد، و رمزگشایی نشانگرهای زیستی مهم یا اهداف دارویی بالقوهای که باید بیشتر بررسی کنیم. نکته مهم این است که پروفایل مولکولی و در نتیجه فنوتیپ بیماری مرتبط با هر بیمار، برای هر فرد منحصر به فرد است. تطبیق درمانها با پروفایل مولکولی یک فرد نیاز به اندازهگیریهایی دارد که عوامل سلولی و مولکولی موثر بر پاسخ به درمان را ثبت کند، و همچنین فناوریهای هوش مصنوعی قدرتمندی که به طور قوی آن عوامل را از مجموعههای دادههای زیست پزشکی بزرگ و با ابعاد بالا که از آزمایشهای مختلف به دست میآیند، پیشبینی کند.
در حالی که ما این دستاوردهای باورنکردنی هوش مصنوعی را در بینایی و زبان میبینیم، دادههای زیستی بسیار متفاوت هستند: اندازهگیریها غیرمستقیم، مبهم، چندوجهی هستند و تنها نماهایی از یک سیستم ذاتاً پویا را نشان میدهند که بر فرآیندهای زیستی زیربنایی حاکم است. ما نمیتوانیم فقط فناوریهای هوش مصنوعی را که برای زبان توسعه یافتهاند، در زمینه زیستشناسی به کار ببریم، بلکه باید معماریها و الگوریتمهای یادگیری را با پیچیدگیهای دادهها و سیستمهای زیستی سازگار کنیم.
در حالی که این مدلهای شبکه عصبی بزرگ که ما توسعه میدهیم، اغلب از نظر پیشبینیهایشان جعبههای سیاه هستند، باید آنها را به گونهای طراحی کنیم که حداقل بفهمیم کدام عوامل زیستی در یک پیشبینی نقش داشتهاند. این درک برای کشف نشانگرهای زیستی و اهداف دارویی بسیار مهم است، زیرا مکانیسمها و مسیرهای زیستی خاص مرتبط با بیماری را برجسته میکند و فرصتهای درمانی جدیدی را آشکار میکند.
کمی در مورد پیشینه خود بگویید - چگونه شروع به کار در این حوزه واقعاً پیشرفته کردید، چگونه این موضوع توجه شما را جلب کرد؟
من زود شروع کردم! در 14 سالگی بخشی از یک برنامه بورسیه دبیرستانی در مرکز تحقیقات سرطان آلمان بودم و از کار بر روی زیستشناسی مصنوعی، رشتهای که مهندسی، علوم کامپیوتر و بیوتکنولوژی را ترکیب میکند، شگفتزده شدم. از آن زمان، من متقاعد شدهام که تنها رویکردهای واقعاً بینرشتهای به ما این امکان را میدهند که به اهداف خود برسیم. اکنون، در مقام استادی، من به طور مشترک با دانشکده علوم زیستی و دانشکده علوم کامپیوتر EPFL وابسته هستم.
به عنوان یک دانشآموز دبیرستانی، ما سلولهای باکتریایی ساده را اصلاح کردیم تا عملکرد جدیدی داشته باشند: این به ما این امکان را داد تا از آنها به عنوان ماشینهای کوچک در یک محصول استفاده کنیم. اکنون، من علاقهمندم که چگونه میتوانیم سلولهای انسانی را مهندسی کنیم تا خواص تشخیصی داشته باشند، چگونه میتوانیم رفتار آنها را در برابر درمانها پیشبینی کنیم یا چگونه میتوانیم آنها را از یک وضعیت بیمار به یک وضعیت سالم بازبرنامهریزی کنیم. بنابراین، حتی اگر اهداف، ابزارها و به ویژه سطح پیچیدگی نمیتوانستند با کاری که من در 14 سالگی انجام میدادم متفاوتتر باشند، جوهره یکسان باقی میماند.
واضح است که این زمینه تحقیقاتی یک محرک مهم به سوی پزشکی شخصی است. این حوزه با چه سرعتی در حال تکامل است، و آیا واقعاً در چند سال گذشته با پیشرفتهای هوش مصنوعی به اوج خود رسیده است؟
من یک محقق جوان هستم، بنابراین به انقلابی پیوستهام که مدتی است در حال وقوع است. این حوزه به دلیل روشی که اکنون میتوانیم دادههای زیستی با توان عملیاتی بالا را با رزولوشن بیسابقهای تولید کنیم، در زمانهای اخیر به طرز باورنکردنی سریعی متحول شده است. سازماندهی مجموعههای عظیم دادههای زیست پزشکی، پایهای برای آموزش شبکههای عصبی بزرگ است. به عنوان مثال، بسیاری از موفقیتهای آخرین جایزه نوبل شیمی، که به طور مشترک به دانشمندانی اعطا شد که ابزار پیشبینی ساختار پروتئین AlphaFold را توسعه دادند، به لطف بانک اطلاعات پروتئین، مجموعهای بزرگ از ساختارهای پروتئینی است که به صورت رایگان در دسترس همه قرار دارد.
تحقیقات ما یک سطح بالاتر اتفاق میافتد، جایی که ما در تلاش هستیم تا عملکرد زیستی و رفتار سلولها و بافتها را شبیهسازی کنیم. ما مدلهای هوش مصنوعی خود را بر اساس دادههایی قرار میدهیم که صدها ویژگی را در سلولهای منفرد اندازهگیری میکند و بینشهایی را در مورد محل زیر سلولی، حضور و فراوانی پروتئینها و مولکولهای منفرد در داخل یک سلول ارائه میدهد. ما به طور فزایندهای این دادههای بسیار غنی را در پایگاههای داده جمعآوری میکنیم، بنابراین پیشرفت به دلیل ترکیبی از در دسترس بودن نمونههای بیشتر و دریافت دادههای بسیار غنی و بسیار با وضوح بالا از سلولهای انسانی است.
اغلب، با این حال، ما هنوز در رژیمهای کم داده کار میکنیم و فاقد مجموعههای داده جامع هستیم که، به عنوان مثال، فرآیندهای سلولی پویا را در طول زمان و در مقیاسهای فیزیکی ثبت کنند: به ویژه، دادههای جفت شده که تغییرات مولکولی را به رفتارهای سطح بافتی مرتبط میکنند، کمیاب هستند، به این معنی که هنگام توسعه سیستمهای هوش مصنوعی برای غلبه بر این محدودیتها، باید خلاق باشیم.
درک کامل پیچیدگی سیستمهای زیستی - که شامل تعاملات مولکولی بیشماری است که برای پویایی کلی سطح سیستم در مقیاسهای زمانی از پیکوثانیه تا فرآیندهایی که در طول سالها رخ میدهند، سازماندهی میشوند - یک کار عظیم است.
- شارلوت بون
شما به جمعآوری دادهها و پایگاههای دادهای که اساس اساسی کار شما هستند، اشاره کردید. واضح است که مسائلی در مورد حریم خصوصی و نحوه استفاده از دادههای بیمار برای آموزش الگوریتمهای یادگیری ماشین وجود دارد. این چگونه کار میکند و سوئیس در زمینه جهانی در چه جایگاهی قرار دارد؟
مطمئناً، دادههای بیمار نیاز به بالاترین حساسیت دارد. چنین دادههایی در محیطهای محاسباتی امن نگهداری میشوند و مقررات حفاظت از دادهها الزامات سختگیرانهای را برای رسیدگی و پردازش چنین دادههایی تعیین میکنند. آنچه که تا حدودی در سوئیس منحصر به فرد است، هماهنگی تلاشها برای توسعه زیرساختهای دادهای قابل تعامل است که دسترسی و تبادل سراسری دادههای مرتبط با سلامت را امکانپذیر میسازد. این امر پایهای را برای توسعه الگوریتمهای هوش مصنوعی که از پایگاههای داده رو به رشد دادههای متنوع و نماینده بیمار استفاده میکنند، ایجاد میکند. کار ما از این تلاشها و اکوسیستمهای فوقالعادهای که در سالهای گذشته در سوئیس ایجاد شدهاند، سود میبرد.
یکی دیگر از ارکان اصلی تحقیقات ما، تبادل نزدیک با پزشکان و زیستشناسان است. برای ما، این به این معنی است که ما در حال توسعه راهکارهای هوش مصنوعی خود در همکاری نزدیک هستیم و میتوانیم آنها را به گونهای تطبیق دهیم که ابزارهای تشخیصی که میسازیم، به طور یکپارچه در روالها و فرآیندهای بالینی ادغام شوند. در عین حال، این همکاریهای نزدیک با پزشکان و زیستشناسان به ما این امکان را میدهد که بر تولید دادههای آینده در زمینههایی که دادهها کم نمونهبرداری شدهاند، تأثیر بگذاریم و آن را هدایت کنیم، یا اندازهگیریهای شیوههای دادهای را که بینشهای عمیقتری را در مورد ترکیب مولکولی سلولها و بافتها ارائه میدهند، اولویتبندی کنیم. ما انتظار داریم که چنین جمعآوری دادههای هدایت شده با هوش مصنوعی به طور قابل توجهی قابلیتهای مدلهای هوش مصنوعی که میسازیم را بهبود بخشد.
شما همچنین در یک جامعه جهانی که هدف آن توسعه سلولهای مجازی مجهز به هوش مصنوعی است، مشارکت دارید. اینها چه هستند و چگونه تحقیقات کنونی را پیش خواهند برد؟
راههای بیشماری برای اندازهگیری زیستشناسی در مقیاسهای فیزیکی مختلف، از تعاملات مولکولی گرفته تا معماری بافتی وجود دارد. سؤالی که ما قصد داریم به آن پاسخ دهیم این است: چگونه میتوانیم همه این اندازهگیریها را ادغام کنیم تا تصویر کامل و درک جامعی از رفتار و عملکرد سلول به دست آوریم؟ به طور خاص، آیا میتوانیم پیشبینی کنیم که وضعیت مولکولی یک سلول پس از یک اختلال خارجی مانند دارو، یک تأثیر محیطی، یک بیماری، یک درمان چگونه تغییر خواهد کرد؟ اساساً، ما میخواهیم بفهمیم که چرا یک سلول به جای دیگری یک وضعیت خاص را اتخاذ میکند.
با پیشرفت در تکنیکهای اندازهگیری و معماریهای هوش مصنوعی به طور فزاینده قدرتمند، ما اکنون شروع به داشتن ابزارهایی برای مقابله با چنین چالشهایی کردهایم. برخی از این مدلهای هوش مصنوعی بر اساس دادههای اندازهگیری تک سلولی ساخته شدهاند، در حالی که برخی دیگر بر رمزگشایی زبان DNA یا پیشبینی تاشدگی پروتئین تمرکز دارند. چشمانداز این است که یک مدل پایه چندوجهی و چند مقیاسی - یک سلول مجازی مجهز به هوش مصنوعی - ایجاد کنیم که همه این تلاشها و اندازهگیریها را ادغام کند و رفتار مولکولها، سلولها و بافتها را در طیف وسیعی از حالات و شرایط نشان دهد و شبیهسازی کند. یک سلول مجازی هوش مصنوعی به عنوان یک شبیهساز جهانی آموخته شده عمل میکند که قادر است سیستمهای سلولی را در شرایط مختلف، از جمله تمایز، حالات بیماری، نوسانات تصادفی و تأثیرات محیطی مدلسازی کند.
این یک تلاش عظیم و مشارکتی است که شامل یک جامعه تحقیقاتی جهانی است. بسیاری از گروهها بر روی اجزای مختلف این پازل کار میکنند، و چالش و فرصت ما در ادغام این مشارکتها در یک چشمانداز منسجم است که مرزهای آنچه در تحقیقات زیست پزشکی ممکن است را جابجا خواهد کرد.
اگر یک توپ بلورین داشتید، هوش مصنوعی را در زیست پزشکی در یک دهه آینده کجا میدیدید؟ ده سال دیگر چه خواهید کرد؟
برخی از وظایف آسانتر در زیستشناسی وجود دارد که ممکن است حل کرده باشیم و بتوانیم پیشبینیهای دقیقی انجام دهیم. داستانهای موفقی مانند AlphaFold نشان میدهند که میتوانیم مسائل خاص و مجزا را حل کنیم، و من انتظار دارم که در دهه آینده پیشرفتهای بیشتری از این دست رخ دهد. با این حال، درک کامل پیچیدگی سیستمهای زیستی - که شامل تعاملات مولکولی بیشماری است که برای پویایی کلی سطح سیستم در مقیاسهای زمانی از پیکوثانیه تا فرآیندهایی که در طول سالها رخ میدهند، سازماندهی میشوند - یک کار عظیم است. من معتقدم که مشکلات بیشماری برای حل کردن و سؤالاتی برای پاسخ دادن در سالهای بسیار، بسیار آینده خواهیم داشت.