شارلوت بون در مورد توسعه ابزارهای تشخیصی مبتنی بر هوش مصنوعی

توسط تانیا پترسن

شارلوت بون، رئیس گروه هوش مصنوعی در پزشکی مولکولی EPFL، در حال توسعه الگوریتم‌های هوش مصنوعی برای درک بهتر داده‌های فوق‌العاده پیچیده و با ابعاد بالا است که نشان‌دهنده صدها لایه بافتی و نشانگرهای پروتئینی در یک سلول منفرد است. مجله EPFL با عنوان Dimensions با شارلوت بون در مورد کارش در خط مقدم هوش مصنوعی در پزشکی و زیست‌شناسی صحبت کرد.

می‌توانید تمرکز تحقیقات خود را شرح دهید؟

ما در حال توسعه ابزارهای تشخیصی برای کلینیک‌ها هستیم که توسط فناوری‌های هوش مصنوعی هدایت می‌شوند. این شامل پیش‌بینی بهترین درمانی است که یک بیمار باید دریافت کند، تلاش برای درک وضعیت بیماری که بیمار در آن قرار دارد، و رمزگشایی نشانگرهای زیستی مهم یا اهداف دارویی بالقوه‌ای که باید بیشتر بررسی کنیم. نکته مهم این است که پروفایل مولکولی و در نتیجه فنوتیپ بیماری مرتبط با هر بیمار، برای هر فرد منحصر به فرد است. تطبیق درمان‌ها با پروفایل مولکولی یک فرد نیاز به اندازه‌گیری‌هایی دارد که عوامل سلولی و مولکولی موثر بر پاسخ به درمان را ثبت کند، و همچنین فناوری‌های هوش مصنوعی قدرتمندی که به طور قوی آن عوامل را از مجموعه‌های داده‌های زیست پزشکی بزرگ و با ابعاد بالا که از آزمایش‌های مختلف به دست می‌آیند، پیش‌بینی کند.

در حالی که ما این دستاوردهای باورنکردنی هوش مصنوعی را در بینایی و زبان می‌بینیم، داده‌های زیستی بسیار متفاوت هستند: اندازه‌گیری‌ها غیرمستقیم، مبهم، چندوجهی هستند و تنها نماهایی از یک سیستم ذاتاً پویا را نشان می‌دهند که بر فرآیندهای زیستی زیربنایی حاکم است. ما نمی‌توانیم فقط فناوری‌های هوش مصنوعی را که برای زبان توسعه یافته‌اند، در زمینه زیست‌شناسی به کار ببریم، بلکه باید معماری‌ها و الگوریتم‌های یادگیری را با پیچیدگی‌های داده‌ها و سیستم‌های زیستی سازگار کنیم.

در حالی که این مدل‌های شبکه عصبی بزرگ که ما توسعه می‌دهیم، اغلب از نظر پیش‌بینی‌هایشان جعبه‌های سیاه هستند، باید آنها را به گونه‌ای طراحی کنیم که حداقل بفهمیم کدام عوامل زیستی در یک پیش‌بینی نقش داشته‌اند. این درک برای کشف نشانگرهای زیستی و اهداف دارویی بسیار مهم است، زیرا مکانیسم‌ها و مسیرهای زیستی خاص مرتبط با بیماری را برجسته می‌کند و فرصت‌های درمانی جدیدی را آشکار می‌کند.

کمی در مورد پیشینه خود بگویید - چگونه شروع به کار در این حوزه واقعاً پیشرفته کردید، چگونه این موضوع توجه شما را جلب کرد؟

من زود شروع کردم! در 14 سالگی بخشی از یک برنامه بورسیه دبیرستانی در مرکز تحقیقات سرطان آلمان بودم و از کار بر روی زیست‌شناسی مصنوعی، رشته‌ای که مهندسی، علوم کامپیوتر و بیوتکنولوژی را ترکیب می‌کند، شگفت‌زده شدم. از آن زمان، من متقاعد شده‌ام که تنها رویکردهای واقعاً بین‌رشته‌ای به ما این امکان را می‌دهند که به اهداف خود برسیم. اکنون، در مقام استادی، من به طور مشترک با دانشکده علوم زیستی و دانشکده علوم کامپیوتر EPFL وابسته هستم.

به عنوان یک دانش‌آموز دبیرستانی، ما سلول‌های باکتریایی ساده را اصلاح کردیم تا عملکرد جدیدی داشته باشند: این به ما این امکان را داد تا از آنها به عنوان ماشین‌های کوچک در یک محصول استفاده کنیم. اکنون، من علاقه‌مندم که چگونه می‌توانیم سلول‌های انسانی را مهندسی کنیم تا خواص تشخیصی داشته باشند، چگونه می‌توانیم رفتار آنها را در برابر درمان‌ها پیش‌بینی کنیم یا چگونه می‌توانیم آنها را از یک وضعیت بیمار به یک وضعیت سالم بازبرنامه‌ریزی کنیم. بنابراین، حتی اگر اهداف، ابزارها و به ویژه سطح پیچیدگی نمی‌توانستند با کاری که من در 14 سالگی انجام می‌دادم متفاوت‌تر باشند، جوهره یکسان باقی می‌ماند.

واضح است که این زمینه تحقیقاتی یک محرک مهم به سوی پزشکی شخصی است. این حوزه با چه سرعتی در حال تکامل است، و آیا واقعاً در چند سال گذشته با پیشرفت‌های هوش مصنوعی به اوج خود رسیده است؟

من یک محقق جوان هستم، بنابراین به انقلابی پیوسته‌ام که مدتی است در حال وقوع است. این حوزه به دلیل روشی که اکنون می‌توانیم داده‌های زیستی با توان عملیاتی بالا را با رزولوشن بی‌سابقه‌ای تولید کنیم، در زمان‌های اخیر به طرز باورنکردنی سریعی متحول شده است. سازماندهی مجموعه‌های عظیم داده‌های زیست پزشکی، پایه‌ای برای آموزش شبکه‌های عصبی بزرگ است. به عنوان مثال، بسیاری از موفقیت‌های آخرین جایزه نوبل شیمی، که به طور مشترک به دانشمندانی اعطا شد که ابزار پیش‌بینی ساختار پروتئین AlphaFold را توسعه دادند، به لطف بانک اطلاعات پروتئین، مجموعه‌ای بزرگ از ساختارهای پروتئینی است که به صورت رایگان در دسترس همه قرار دارد.

تحقیقات ما یک سطح بالاتر اتفاق می‌افتد، جایی که ما در تلاش هستیم تا عملکرد زیستی و رفتار سلول‌ها و بافت‌ها را شبیه‌سازی کنیم. ما مدل‌های هوش مصنوعی خود را بر اساس داده‌هایی قرار می‌دهیم که صدها ویژگی را در سلول‌های منفرد اندازه‌گیری می‌کند و بینش‌هایی را در مورد محل زیر سلولی، حضور و فراوانی پروتئین‌ها و مولکول‌های منفرد در داخل یک سلول ارائه می‌دهد. ما به طور فزاینده‌ای این داده‌های بسیار غنی را در پایگاه‌های داده جمع‌آوری می‌کنیم، بنابراین پیشرفت به دلیل ترکیبی از در دسترس بودن نمونه‌های بیشتر و دریافت داده‌های بسیار غنی و بسیار با وضوح بالا از سلول‌های انسانی است.

اغلب، با این حال، ما هنوز در رژیم‌های کم داده کار می‌کنیم و فاقد مجموعه‌های داده جامع هستیم که، به عنوان مثال، فرآیندهای سلولی پویا را در طول زمان و در مقیاس‌های فیزیکی ثبت کنند: به ویژه، داده‌های جفت شده که تغییرات مولکولی را به رفتارهای سطح بافتی مرتبط می‌کنند، کمیاب هستند، به این معنی که هنگام توسعه سیستم‌های هوش مصنوعی برای غلبه بر این محدودیت‌ها، باید خلاق باشیم.

درک کامل پیچیدگی سیستم‌های زیستی - که شامل تعاملات مولکولی بی‌شماری است که برای پویایی کلی سطح سیستم در مقیاس‌های زمانی از پیکوثانیه تا فرآیندهایی که در طول سال‌ها رخ می‌دهند، سازماندهی می‌شوند - یک کار عظیم است.
- شارلوت بون

شما به جمع‌آوری داده‌ها و پایگاه‌های داده‌ای که اساس اساسی کار شما هستند، اشاره کردید. واضح است که مسائلی در مورد حریم خصوصی و نحوه استفاده از داده‌های بیمار برای آموزش الگوریتم‌های یادگیری ماشین وجود دارد. این چگونه کار می‌کند و سوئیس در زمینه جهانی در چه جایگاهی قرار دارد؟

مطمئناً، داده‌های بیمار نیاز به بالاترین حساسیت دارد. چنین داده‌هایی در محیط‌های محاسباتی امن نگهداری می‌شوند و مقررات حفاظت از داده‌ها الزامات سختگیرانه‌ای را برای رسیدگی و پردازش چنین داده‌هایی تعیین می‌کنند. آنچه که تا حدودی در سوئیس منحصر به فرد است، هماهنگی تلاش‌ها برای توسعه زیرساخت‌های داده‌ای قابل تعامل است که دسترسی و تبادل سراسری داده‌های مرتبط با سلامت را امکان‌پذیر می‌سازد. این امر پایه‌ای را برای توسعه الگوریتم‌های هوش مصنوعی که از پایگاه‌های داده رو به رشد داده‌های متنوع و نماینده بیمار استفاده می‌کنند، ایجاد می‌کند. کار ما از این تلاش‌ها و اکوسیستم‌های فوق‌العاده‌ای که در سال‌های گذشته در سوئیس ایجاد شده‌اند، سود می‌برد.

یکی دیگر از ارکان اصلی تحقیقات ما، تبادل نزدیک با پزشکان و زیست‌شناسان است. برای ما، این به این معنی است که ما در حال توسعه راهکارهای هوش مصنوعی خود در همکاری نزدیک هستیم و می‌توانیم آنها را به گونه‌ای تطبیق دهیم که ابزارهای تشخیصی که می‌سازیم، به طور یکپارچه در روال‌ها و فرآیندهای بالینی ادغام شوند. در عین حال، این همکاری‌های نزدیک با پزشکان و زیست‌شناسان به ما این امکان را می‌دهد که بر تولید داده‌های آینده در زمینه‌هایی که داده‌ها کم نمونه‌برداری شده‌اند، تأثیر بگذاریم و آن را هدایت کنیم، یا اندازه‌گیری‌های شیوه‌های داده‌ای را که بینش‌های عمیق‌تری را در مورد ترکیب مولکولی سلول‌ها و بافت‌ها ارائه می‌دهند، اولویت‌بندی کنیم. ما انتظار داریم که چنین جمع‌آوری داده‌های هدایت شده با هوش مصنوعی به طور قابل توجهی قابلیت‌های مدل‌های هوش مصنوعی که می‌سازیم را بهبود بخشد.

شما همچنین در یک جامعه جهانی که هدف آن توسعه سلول‌های مجازی مجهز به هوش مصنوعی است، مشارکت دارید. اینها چه هستند و چگونه تحقیقات کنونی را پیش خواهند برد؟

راه‌های بی‌شماری برای اندازه‌گیری زیست‌شناسی در مقیاس‌های فیزیکی مختلف، از تعاملات مولکولی گرفته تا معماری بافتی وجود دارد. سؤالی که ما قصد داریم به آن پاسخ دهیم این است: چگونه می‌توانیم همه این اندازه‌گیری‌ها را ادغام کنیم تا تصویر کامل و درک جامعی از رفتار و عملکرد سلول به دست آوریم؟ به طور خاص، آیا می‌توانیم پیش‌بینی کنیم که وضعیت مولکولی یک سلول پس از یک اختلال خارجی مانند دارو، یک تأثیر محیطی، یک بیماری، یک درمان چگونه تغییر خواهد کرد؟ اساساً، ما می‌خواهیم بفهمیم که چرا یک سلول به جای دیگری یک وضعیت خاص را اتخاذ می‌کند.

با پیشرفت در تکنیک‌های اندازه‌گیری و معماری‌های هوش مصنوعی به طور فزاینده قدرتمند، ما اکنون شروع به داشتن ابزارهایی برای مقابله با چنین چالش‌هایی کرده‌ایم. برخی از این مدل‌های هوش مصنوعی بر اساس داده‌های اندازه‌گیری تک سلولی ساخته شده‌اند، در حالی که برخی دیگر بر رمزگشایی زبان DNA یا پیش‌بینی تاشدگی پروتئین تمرکز دارند. چشم‌انداز این است که یک مدل پایه چندوجهی و چند مقیاسی - یک سلول مجازی مجهز به هوش مصنوعی - ایجاد کنیم که همه این تلاش‌ها و اندازه‌گیری‌ها را ادغام کند و رفتار مولکول‌ها، سلول‌ها و بافت‌ها را در طیف وسیعی از حالات و شرایط نشان دهد و شبیه‌سازی کند. یک سلول مجازی هوش مصنوعی به عنوان یک شبیه‌ساز جهانی آموخته شده عمل می‌کند که قادر است سیستم‌های سلولی را در شرایط مختلف، از جمله تمایز، حالات بیماری، نوسانات تصادفی و تأثیرات محیطی مدل‌سازی کند.

این یک تلاش عظیم و مشارکتی است که شامل یک جامعه تحقیقاتی جهانی است. بسیاری از گروه‌ها بر روی اجزای مختلف این پازل کار می‌کنند، و چالش و فرصت ما در ادغام این مشارکت‌ها در یک چشم‌انداز منسجم است که مرزهای آنچه در تحقیقات زیست پزشکی ممکن است را جابجا خواهد کرد.

اگر یک توپ بلورین داشتید، هوش مصنوعی را در زیست پزشکی در یک دهه آینده کجا می‌دیدید؟ ده سال دیگر چه خواهید کرد؟

برخی از وظایف آسان‌تر در زیست‌شناسی وجود دارد که ممکن است حل کرده باشیم و بتوانیم پیش‌بینی‌های دقیقی انجام دهیم. داستان‌های موفقی مانند AlphaFold نشان می‌دهند که می‌توانیم مسائل خاص و مجزا را حل کنیم، و من انتظار دارم که در دهه آینده پیشرفت‌های بیشتری از این دست رخ دهد. با این حال، درک کامل پیچیدگی سیستم‌های زیستی - که شامل تعاملات مولکولی بی‌شماری است که برای پویایی کلی سطح سیستم در مقیاس‌های زمانی از پیکوثانیه تا فرآیندهایی که در طول سال‌ها رخ می‌دهند، سازماندهی می‌شوند - یک کار عظیم است. من معتقدم که مشکلات بی‌شماری برای حل کردن و سؤالاتی برای پاسخ دادن در سال‌های بسیار، بسیار آینده خواهیم داشت.