محققان دپارتمان زیست‌شناسی یک روش محاسباتی به نام FragFold توسعه داده‌اند تا به طور سیستماتیک پیش‌بینی کنند که کدام قطعات پروتئینی ممکن است عملکرد یک پروتئین هدف را مهار کنند. تصویر نمونه‌ای از یکی از تعاملاتی را نشان می‌دهد که محققان بررسی کردند: یک مجموعه پروتئینی بین پروتئین‌های انتقال لیپوپلی ساکارید LptF (سفید) و LptG (سبز). قطعه پروتئینی LptG (قرمز) این تعامل را مهار می‌کند و احتمالاً تحویل لیپوپلی ساکارید را مختل می‌کند، که یک جزء حیاتی از غشای خارجی سلولی E. coli است که برای تناسب اندام سلولی ضروری است. تصویر با مجوز Andrew Savinov.
محققان دپارتمان زیست‌شناسی یک روش محاسباتی به نام FragFold توسعه داده‌اند تا به طور سیستماتیک پیش‌بینی کنند که کدام قطعات پروتئینی ممکن است عملکرد یک پروتئین هدف را مهار کنند. تصویر نمونه‌ای از یکی از تعاملاتی را نشان می‌دهد که محققان بررسی کردند: یک مجموعه پروتئینی بین پروتئین‌های انتقال لیپوپلی ساکارید LptF (سفید) و LptG (سبز). قطعه پروتئینی LptG (قرمز) این تعامل را مهار می‌کند و احتمالاً تحویل لیپوپلی ساکارید را مختل می‌کند، که یک جزء حیاتی از غشای خارجی سلولی E. coli است که برای تناسب اندام سلولی ضروری است. تصویر با مجوز Andrew Savinov.

سامانه هوش مصنوعی قطعات پروتئینی را پیش‌بینی می‌کند که می‌توانند به هدف متصل شده یا آن را مهار کنند

تمام عملکردهای بیولوژیکی به نحوه تعامل پروتئین‌های مختلف با یکدیگر بستگی دارد. تعاملات پروتئین-پروتئین همه چیز را از رونویسی DNA و کنترل تقسیم سلولی گرفته تا عملکردهای سطح بالاتر در موجودات پیچیده تسهیل می‌کند.

با این حال، هنوز مشخص نیست که چگونه این عملکردها در سطح مولکولی تنظیم می‌شوند و چگونه پروتئین‌ها با یکدیگر تعامل می‌کنند - چه با پروتئین‌های دیگر و چه با نسخه‌هایی از خود.

یافته‌های اخیر نشان داده است که قطعات کوچک پروتئینی پتانسیل عملکردی زیادی دارند. حتی اگر قطعات ناقصی باشند، کشیدگی‌های کوتاه اسیدهای آمینه همچنان می‌توانند به رابط‌های یک پروتئین هدف متصل شوند و تعاملات بومی را تکرار کنند. از طریق این فرآیند، آنها می‌توانند عملکرد آن پروتئین را تغییر دهند یا تعاملات آن را با سایر پروتئین‌ها مختل کنند.

بنابراین، قطعات پروتئینی می‌توانند تحقیقات پایه در مورد تعاملات پروتئینی و فرآیندهای سلولی را تقویت کنند و به طور بالقوه کاربردهای درمانی داشته باشند.

اخیراً در مجموعه مقالات آکادمی ملی علوم منتشر شده است، روش جدیدی که در دپارتمان زیست‌شناسی توسعه یافته است، بر اساس مدل‌های هوش مصنوعی موجود است تا به طور محاسباتی قطعات پروتئینی را پیش‌بینی کند که می‌توانند به پروتئین‌های کامل در E. coli متصل شده و آنها را مهار کنند. از لحاظ نظری، این ابزار می‌تواند منجر به مهارکننده‌های ژنتیکی قابل رمزگذاری در برابر هر پروتئینی شود.

این کار در آزمایشگاه Gene-Wei Li، استادیار زیست‌شناسی و محقق موسسه پزشکی Howard Hughes، با همکاری آزمایشگاه Jay A. Stein (1968)، استاد زیست‌شناسی، استاد مهندسی زیستی و رئیس دپارتمان Amy Keating انجام شد.

بهره‌گیری از یادگیری ماشین

این برنامه، به نام FragFold، از AlphaFold، یک مدل هوش مصنوعی که به دلیل توانایی آن در پیش‌بینی تاشدگی پروتئین و تعاملات پروتئین، منجر به پیشرفت‌های چشمگیری در زیست‌شناسی در سال‌های اخیر شده است، استفاده می‌کند.

هدف این پروژه پیش‌بینی مهارکننده‌های قطعه‌ای بود که یک کاربرد جدید از AlphaFold است. محققان در این پروژه به طور تجربی تأیید کردند که بیش از نیمی از پیش‌بینی‌های FragFold برای اتصال یا مهار دقیق بودند، حتی زمانی که محققان هیچ داده ساختاری قبلی در مورد مکانیسم‌های آن تعاملات نداشتند.

اندرو ساوینوف، نویسنده اول و مسئول این مقاله و محقق فوق دکترا در آزمایشگاه Li می‌گوید: «نتایج ما نشان می‌دهد که این یک رویکرد قابل تعمیم برای یافتن حالت‌های اتصال است که احتمالاً عملکرد پروتئین را مهار می‌کنند، از جمله برای اهداف پروتئینی جدید، و می‌توانید از این پیش‌بینی‌ها به عنوان نقطه شروعی برای آزمایش‌های بیشتر استفاده کنید.» «ما واقعاً می‌توانیم این را برای پروتئین‌ها بدون عملکردهای شناخته شده، بدون تعاملات شناخته شده، حتی بدون ساختارهای شناخته شده اعمال کنیم، و می‌توانیم به این مدل‌هایی که در حال توسعه آن هستیم، اعتبار ببخشیم.»

یکی از این موارد FtsZ است، پروتئینی که برای تقسیم سلولی کلیدی است. این پروتئین به خوبی مطالعه شده است، اما حاوی ناحیه‌ای است که ذاتاً نامنظم است و بنابراین، به ویژه مطالعه آن چالش‌برانگیز است. پروتئین‌های نامنظم پویا هستند و تعاملات عملکردی آنها بسیار زودگذر است - آنقدر کوتاه رخ می‌دهد که ابزارهای زیست‌شناسی ساختاری فعلی نمی‌توانند یک ساختار یا تعامل واحد را ثبت کنند.

محققان از FragFold برای بررسی فعالیت قطعات FtsZ، از جمله قطعات ناحیه ذاتاً نامنظم، برای شناسایی چندین تعامل اتصال جدید با پروتئین‌های مختلف استفاده کردند. این جهش در درک، آزمایش‌های قبلی اندازه‌گیری فعالیت بیولوژیکی FtsZ را تأیید و گسترش می‌دهد.

این پیشرفت تا حدی به این دلیل قابل توجه است که بدون حل ساختار ناحیه نامنظم انجام شده است و به این دلیل که پتانسیل قدرت FragFold را نشان می‌دهد.

Keating می‌گوید: «این یک نمونه از این است که چگونه AlphaFold اساساً نحوه مطالعه زیست‌شناسی مولکولی و سلولی را تغییر می‌دهد.» «کاربردهای خلاقانه روش‌های هوش مصنوعی، مانند کار ما در FragFold، قابلیت‌های غیرمنتظره و مسیرهای تحقیقاتی جدیدی را باز می‌کنند.»

مهار، و فراتر از آن

محققان این پیش‌بینی‌ها را با قطعه‌قطعه کردن محاسباتی هر پروتئین و سپس مدل‌سازی نحوه اتصال آن قطعات به شرکای تعاملی که فکر می‌کردند مرتبط هستند، انجام دادند.

آنها نقشه‌های اتصال پیش‌بینی‌شده را در سراسر توالی کامل با اثرات همان قطعات در سلول‌های زنده مقایسه کردند، که با استفاده از اندازه‌گیری‌های تجربی با توان بالا تعیین شد که در آن میلیون‌ها سلول هر کدام یک نوع قطعه پروتئینی تولید می‌کنند.

AlphaFold از اطلاعات هم‌تکاملی برای پیش‌بینی تاشدگی استفاده می‌کند و معمولاً تاریخچه تکاملی پروتئین‌ها را با استفاده از چیزی به نام هم‌ترازی توالی‌های چندگانه برای هر بار اجرای پیش‌بینی ارزیابی می‌کند. MSAها حیاتی هستند، اما یک گلوگاه برای پیش‌بینی‌های در مقیاس بزرگ هستند - آنها می‌توانند مقدار زیادی زمان و قدرت محاسباتی را صرف کنند.

برای FragFold، محققان در عوض MSA را برای یک پروتئین کامل یک بار از قبل محاسبه کردند و از آن نتیجه برای هدایت پیش‌بینی‌ها برای هر قطعه از آن پروتئین کامل استفاده کردند.

Savinov، به همراه Sebastian Swanson فارغ‌التحصیل آزمایشگاه Keating، قطعات مهاری مجموعه‌ای متنوع از پروتئین‌ها را علاوه بر FtsZ پیش‌بینی کرد. از جمله تعاملاتی که آنها بررسی کردند، مجموعه‌ای بین پروتئین‌های انتقال لیپوپلی ساکارید LptF و LptG بود. یک قطعه پروتئینی LptG این تعامل را مهار کرد و احتمالاً تحویل لیپوپلی ساکارید را مختل کرد، که یک جزء حیاتی از غشای خارجی سلولی E. coli است که برای تناسب اندام سلولی ضروری است.

Savinov می‌گوید: «بزرگترین شگفتی این بود که ما می‌توانیم اتصال را با چنین دقت بالایی پیش‌بینی کنیم و در واقع، اغلب اتصالی را پیش‌بینی می‌کنیم که مربوط به مهار است.» «برای هر پروتئینی که بررسی کرده‌ایم، توانسته‌ایم مهارکننده‌ها را پیدا کنیم.»

محققان در ابتدا بر قطعات پروتئینی به عنوان مهارکننده تمرکز کردند، زیرا اینکه آیا یک قطعه می‌تواند عملکرد ضروری در سلول‌ها را مسدود کند یا خیر، یک نتیجه نسبتاً ساده برای اندازه‌گیری سیستماتیک است. ساوینوف همچنین مشتاق است که عملکرد قطعات را خارج از مهار، مانند قطعاتی که می‌توانند پروتئینی را که به آن متصل می‌شوند تثبیت کنند، عملکرد آن را افزایش یا تغییر دهند، یا تخریب پروتئین را تحریک کنند، بررسی کند.

طراحی، در اصل

این تحقیق نقطه شروعی برای توسعه درک سیستماتیک از اصول طراحی سلولی و اینکه مدل‌های یادگیری عمیق ممکن است از چه عناصری برای ارائه پیش‌بینی‌های دقیق استفاده کنند، است.

Savinov می‌گوید: «یک هدف گسترده‌تر و دورتر وجود دارد که ما در حال ساختن آن هستیم.» «اکنون که می‌توانیم آنها را پیش‌بینی کنیم، آیا می‌توانیم از داده‌هایی که از پیش‌بینی‌ها و آزمایش‌ها داریم برای بیرون کشیدن ویژگی‌های برجسته استفاده کنیم تا بفهمیم AlphaFold در واقع چه چیزی در مورد اینکه چه چیزی یک مهارکننده خوب می‌سازد، آموخته است؟»

Savinov و همکاران همچنین به بررسی بیشتر نحوه اتصال قطعات پروتئینی پرداختند، سایر تعاملات پروتئینی را بررسی کردند و با جهش دادن باقیمانده‌های خاص بررسی کردند که چگونه آن تعاملات نحوه تعامل قطعه با هدف خود را تغییر می‌دهند.

بررسی تجربی رفتار هزاران قطعه جهش‌یافته در داخل سلول‌ها، رویکردی که به عنوان اسکن جهش عمیق شناخته می‌شود، اسیدهای آمینه کلیدی را نشان داد که مسئول مهار هستند. در برخی موارد، قطعات جهش‌یافته حتی مهارکننده‌های قوی‌تری نسبت به توالی‌های طبیعی و کامل خود بودند.

سوانسون می‌گوید: «برخلاف روش‌های قبلی، ما محدود به شناسایی قطعات در داده‌های ساختاری تجربی نیستیم.» «نقطه قوت اصلی این کار، تعامل بین داده‌های مهار تجربی با توان بالا و مدل‌های ساختاری پیش‌بینی‌شده است: داده‌های تجربی ما را به سمت قطعاتی که به‌ویژه جالب هستند، هدایت می‌کنند، در حالی که مدل‌های ساختاری پیش‌بینی‌شده توسط FragFold یک فرضیه خاص و قابل آزمایش برای نحوه عملکرد قطعات در سطح مولکولی ارائه می‌دهند.»

Savinov در مورد آینده این رویکرد و کاربردهای بی‌شمار آن هیجان‌زده است.

Li موافق است: «FragFold با ایجاد بایندرهای فشرده و قابل رمزگذاری ژنتیکی، طیف گسترده‌ای از امکانات را برای دستکاری عملکرد پروتئین باز می‌کند.» «ما می‌توانیم قطعات عملکردی را که می‌توانند پروتئین‌های بومی را اصلاح کنند، محل زیرسلولی آنها را تغییر دهند و حتی آنها را برای ایجاد ابزارهای جدید برای مطالعه زیست‌شناسی سلولی و درمان بیماری‌ها برنامه‌ریزی مجدد کنند، تصور کنیم.»