چرا پیچیدگی فیزیکی ژنوم انسان ممکن است هوش مصنوعی را گیج کند

مقدمه

از زمانی که ساختار مولکولی DNA در دهه ۱۹۵۰ میلادی کشف شد، بسیاری از زیست‌شناسان آن را به عنوان راز حیات ستایش کرده‌اند. آنها اطلاعات ذخیره‌شده در DNA موجود در سلول‌های موجودات زنده را که به آن ژنوم (genome) گفته می‌شود، خوانده و مطالعه کرده و ادعا کرده‌اند که این پایگاه داده ژنتیکی باید نوعی طرح اولیه، کد یا رایانه باشد. اما اگر DNA واقعاً راز بزرگ‌تری در مورد نحوه عملکرد حیات در خود نهفته دارد، زیست‌شناسان هنوز نتوانسته‌اند آن را پیدا کنند.

در واقع، ژنوم انسان کمتر شبیه یک نوشته و بیشتر شبیه یک پازل است که هرچه دقیق‌تر به آن نگاه کنیم، سخت‌تر می‌شود. دانستن کل توالی—یعنی ترتیب تقریباً ۳ میلیارد واحد سازنده شیمیایی DNA ما، که پروژه بین‌المللی ژنوم انسان بین سال‌های ۱۹۹۰ تا ۲۰۰۳ تقریباً به طور کامل آن را رمزگشایی کرد—کمک چندانی نکرده است. این تحقیق نشان داد که تنها حدود ۲ درصد از ژنوم انسان از ژن‌های واقعی، یعنی توالی‌های DNA کدکننده اطلاعات، تشکیل شده است.

اکنون واضح است که درک ژنوم انسان دیگر صرفاً به معنای فهمیدن عملکرد هر ژن نیست. پرسش عمیق‌تر و بسیار دشوارتر این است که این ژن‌ها چگونه استفاده یا تنظیم می‌شوند؛ سؤالی که به نظر می‌رسد شامل بخشی و شاید بسیاری از بقیه ژنوم می‌شود. با روشن و خاموش کردن مجموعه‌هایی از ژن‌ها، انواع مختلف سلول‌های بدن ما می‌توانند همگی از یک ماده اولیه ایجاد شوند. سلول‌ها همچنین ژن‌های خود را لحظه به لحظه در پاسخ به جریان ثابت سیگنال‌ها از سلول‌های همسایه و محیط اطراف تنظیم می‌کنند. اما فرآیندهایی که تنظیم ژن را کنترل می‌کنند، آنقدر پیچیده از آب درآمده‌اند که برخی از زیست‌شناسان به این فکر افتاده‌اند که آیا درک کامل آن—یعنی اینکه ژنوم واقعاً چگونه کار می‌کند—هرگز در دسترس ذهن‌های کوچک ما قرار خواهد گرفت یا خیر.

برخی به برون‌سپاری این تحلیل به هوش مصنوعی (AI) دل بسته‌اند. «مدل‌های پایه» ژنومیک مانند Evo 2، Genos و AlphaGenome گوگل دیپ‌مایند بر روی مقادیر عظیمی از داده‌های ژنومی آموزش دیده‌اند، که زیست‌شناسان از آنها برای پیش‌بینی اینکه چگونه تفاوت‌ها در توالی DNA بر فرآیندهای بیولوژیکی و در نهایت بر ویژگی‌های یک موجود زنده کامل (از جمله خطر بیماری) تأثیر می‌گذارد، استفاده می‌کنند. این الگوریتم‌ها نگران مسائل پیچیده تنظیمی نیستند؛ فرض بر این است که همه اینها توسط «آموزش» الگوریتم پوشش داده می‌شود، که از طریق آن همبستگی‌ها را از مواردی که قبلاً می‌دانیم استنباط می‌کند.

این رویکرد احتمالاً مفید خواهد بود، اما برای کسانی که به دنبال درک واقعی نحوه عملکرد ژنوم و در نهایت خود حیات هستند، یک جعبه سیاه محاسباتی هرگز کافی نخواهد بود. و شاید مهمتر از آن، ژنوم ممکن است به نوع رویکرد ساده ورودی-خروجی که این مدل‌های هوش مصنوعی نهایتاً فرض می‌کنند، تن ندهد.

این به این دلیل است که ژنوم نه یک طرح اولیه است و نه یک الگوریتم. بلکه چیز دیگری است.

تصویری دقیق از رشته‌های DNA و پروتئین‌های مرتبط در هسته سلول. — تصویر: ساختار DNA و پروتئین‌ها در هسته سلول.

دیدگاه قدیمی

با توجه به اینکه ژنوم محصول حدود ۴ میلیارد سال تکامل است، شاید جای تعجب نباشد که پیچیده باشد. اما آنچه باعث شگفتی شده، نوع این پیچیدگی‌ها است. کارن آدلمن، زیست‌شناس دانشکده پزشکی هاروارد که تنظیم ژن را مطالعه می‌کند، می‌گوید: «ژنوم ما آن چیزی نیست که اگر پای میز طراحی می‌نشستیم، آن را می‌ساختیم.»

دیدگاه سنتی این است که بخش کوچکی از DNA ما کد ساخت مولکول‌های پروتئینی را در خود جای داده است که شیمی سلول‌های ما را سازماندهی می‌کنند. هر دستورالعمل برای یک پروتئین در ژن مربوطه قرار دارد—ما حدود ۲۰,۰۰۰ از این ژن‌ها را داریم—و توالی ژن‌ها می‌توانند از چند ده تا تقریباً ۳ میلیون «حرف» DNA (نشان‌دهنده مولکول‌هایی به نام نوکلئوتیدها) طول داشته باشند. ساخت یک پروتئین از روی ژن آن، کاری دو مرحله‌ای است. ابتدا DNA، حرف به حرف، توسط آنزیمی به نام پلیمراز (polymerase) خوانده می‌شود، که یک نسخه از آن کد را در مولکولی مرتبط به نام mRNA (Messenger RNA) یا RNA پیام‌رسان ایجاد می‌کند. این فرآیند را رونویسی (transcription) می‌نامند. سپس mRNA توسط دستگاه مولکولی به نام ریبوزوم (ribosome) خوانده می‌شود، که پروتئین را می‌سازد—این فرآیند را ترجمه (translation) می‌نامند. سپس پروتئین‌های ساخته شده توسط ریبوزوم وظایف خود را در ساخت و نگهداری موجود زنده انجام می‌دهند.

این تصویر کم و بیش هنوز صحیح است. اما آدلمن می‌گوید: «به نظر می‌رسد که ژن‌ها احتمالاً جالب‌ترین بخش ژنوم نیستند.»

آنچه مهم‌تر است این است که ژن‌های ما که بسیاری از آنها را با موجودات ساده‌تر به اشتراک می‌گذاریم، چگونه تنظیم می‌شوند: یعنی روشن و خاموش می‌شوند. نیازهای یک سلول به پروتئین‌ها با گذشت زمان و بسته به نوع سلول تغییر می‌کند: سلول عضلانی، مغزی، پوستی و غیره. نحوه تنظیم ژن‌هایی که این پروتئین‌ها را کد می‌کنند، به بخشی از ژنوم که پروتئین‌ها را کد نمی‌کند، بستگی دارد.

زیست‌شناسان از دهه ۱۹۶۰ میلادی از تنظیم ژن و دخالت DNA «غیرکدکننده» آگاه بوده‌اند. اما برای سال‌ها، بیشتر آنچه در مورد این موضوع می‌دانستند، از مطالعات روی موجودات ساده مانند باکتری‌ها به دست می‌آمد، جایی که اصول به طور کلی ساده‌تر هستند. با این حال، به تدریج روشن شده است که در موجودات یوکاریوتی پیچیده مانند ما، تنظیم ژن بسیار پیچیده‌تر است و شامل سیستم‌های نظارت و کنترل همپوشان است که هر یک ظرافت‌های خاص خود را دارند.

عوامل رونویسی

رونویسی (transcription) توسط پروتئین‌هایی به نام عوامل رونویسی (transcription factors) آغاز می‌شود، که مانند مدیران عملیات تنظیم ژن هستند. این پروتئین‌ها به بخش‌هایی از DNA (معمولاً نزدیک به ژن هدف) متصل می‌شوند و آنزیم پلیمراز را برای ساخت نسخه mRNA فرا می‌خوانند. در باکتری‌ها، عوامل رونویسی تا حدودی شبیه کلیدهایی هستند که به قفل‌های جایگاه‌های اتصال منحصر به فرد روی DNA می‌خورند. اما در موجودات پیچیده، نحوه عملکرد آنها متفاوت است. در ما، منطق عوامل رونویسی دشوارتر است.

اولاً، عوامل رونویسی ما ترجیحات قوی برای جایگاه‌های اتصال DNA خاصی از خود نشان نمی‌دهند. ثانیاً، آنها تمایل دارند به صورت جفتی یا گروهی کار کنند. و یک عامل رونویسی ممکن است در زمینه‌های مختلف، اثرات متفاوتی داشته باشد؛ مثلاً در یک نوع سلول رونویسی ژن را فعال کند، اما در نوع دیگری آن را سرکوب کند، بسته به اینکه چه عوامل رونویسی دیگری در اطراف هستند.

آدلمن می‌گوید: «در باکتری‌ها، تنظیم تمایل به منطق "یا" دارد، که به موجب آن یک سیگنال خاص، ژن را روشن یا خاموش می‌کند: این یا آن است.» اما در ژنوم انسان، این منطق بیشتر شبیه چیزی است که دانشمندان علوم کامپیوتر آن را "و" (AND) می‌نامند. چندین سیگنال برای رسیدن به یک تصمیم تنظیمی با هم ترکیب می‌شوند: این و آن و همچنین آن چیز دیگر. در این حالت، تنظیم می‌تواند نسبت به ظرافت‌های زمینه حساس‌تر باشد، و پیچ‌های تنظیم قابل تنظیم هستند، نه فقط روشن/خاموش. آدلمن می‌گوید: «این بخشی از زیبایی پیچیدگی تنظیمی ما است.»

هنگامی که عوامل رونویسی با ژنوم تعامل می‌کنند، به بخش‌هایی از DNA به نام تقویت‌کننده‌ها (enhancers) متصل می‌شوند—که خود معماهایی را مطرح می‌کنند.

تقویت‌کننده‌ها

تقویت‌کننده‌ها نقاط تجمع برای عوامل رونویسی هستند و تصور می‌شود که تأثیر قاطعی بر رونویسی دارند: آنها سیگنال "شروع" را برای پلیمراز (polymerase) منتظر می‌فرستند تا نسخه mRNA از توالی DNA را بسازد. به اندازه کافی ساده به نظر می‌رسد، اما نقشه‌برداری تقویت‌کننده‌ها به ژن‌های مربوطه بسیار پیچیده است. ژنوم ما صدها هزار، شاید میلیون‌ها تقویت‌کننده دارد. این بدان معناست که ما تعداد تقویت‌کننده‌های بیشتری نسبت به ژن‌ها داریم. هر ژن ممکن است تحت تأثیر چندین تقویت‌کننده قرار گیرد و هر تقویت‌کننده ممکن است چندین ژن را تحت تأثیر قرار دهد.

وندی بیکمور، زیست‌شناس ژنوم در دانشگاه ادینبورگ، می‌گوید: «خجالت‌آور است که ۲۵ سال پس از پروژه ژنوم انسان، ما نمی‌دانیم همه تقویت‌کننده‌ها در ژنوم کجا هستند، چه رسد به اینکه وقتی عمل می‌کنند چه کاری انجام می‌دهند و کدام ژن‌ها را کنترل می‌کنند.»

زیست‌شناسان می‌دانند که بیشتر تقویت‌کننده‌ها به یک عامل رونویسی تنها پاسخ نمی‌دهند. بیکمور می‌گوید: «فعال‌سازی آنها به یک کوکتل نیاز دارد. این همان چیزی است که [به یک تقویت‌کننده] آن دقت بی‌نظیر را می‌دهد—زیرا تنها در یک سلول خاص در یک زمان خاص است که ترکیب درستی از عوامل برای اتصال و فعال کردن آن تقویت‌کننده وجود دارد.»

برخی از تقویت‌کننده‌ها، همانطور که انتظار می‌رود، نزدیک ژن‌هایی هستند که تنظیم می‌کنند، یا حتی روی DNA درون یک ژن قرار دارند. اما برخی دیگر بسیار دور از ژن قرار دارند—شاید میلیون‌ها نوکلئوتید (nucleotide) دورتر، با ژن‌های بیشتری در بین آنها.

بیکمور می‌گوید: «وجود چنین تقویت‌کننده‌هایی به اصطلاح "دور" (distal) دیوانه‌کننده به نظر می‌رسد. چگونه این اطلاعات را از آنجا به اینجا، به ژنی که باید فعال شود، منتقل می‌کنید؟ این سؤالی است که عمدتاً بی‌پاسخ مانده است.»

یکی از پاسخ‌ها در قالب یک حلقه (loop) است.

حلقه‌ها و مراکز

تقویت‌کننده‌های دور (distal enhancers) روی حلقه‌های بزرگ DNA یا به طور دقیق‌تر، کروماتین (chromatin) که ترکیبی از DNA و پروتئین‌های بسته‌بندی آن است و مانند یک کلاف نخ باز می‌شود، به ژنی که تنظیم می‌کنند آورده می‌شوند. این حلقه‌ها توسط یک موتور پروتئینی به نام کوهزین (cohesin) ایجاد می‌شوند که در طول رشته DNA حرکت می‌کند و آن را در صورت نیاز بیرون می‌کشد.

هنگامی که کوهزین یک حلقه برای گردآوردن عناصر تشکیل داد، سپس چه اتفاقی می‌افتد؟ زمانی تصور می‌شد که آنها به هم می‌چسبند یا در یک ماشین مولکولی مونتاژ می‌شوند، اما اینطور نیست. بلکه به نظر می‌رسد که اجزا یک توده شل اما متراکم را تشکیل می‌دهند که در آن به طور ضعیف، گذرا و بی‌هدف با یکدیگر تعامل می‌کنند—نوعی کمیته، که گاهی اوقات کندانسات (condensate) نامیده می‌شود.

این مراکز رونویسی (transcription hubs) بسیار سیال هستند و از یک سلول به سلول دیگر متفاوتند. بیکمور می‌گوید: «کمی برون‌ریزی حلقه (loop extrusion) در اینجا اتفاق می‌افتد، در سلول بعدی ممکن است در آنجا باشد، و کل فرآیند به طور فوق‌العاده‌ای سریع در حال تغییر است.» حتی اگر سلول‌ها به طور نظری یکسان باشند—مثلاً هر دو سلول پوستی—آنچه ماشین‌آلات تنظیم ژن در هر لحظه انجام می‌دهند، هرگز در دو سلول دقیقاً یکسان نیست.

حلقه‌های کروماتین تنها یکی از دلایلی هستند که رونویسی یک ژن به شکل و ساختار کروماتین اطراف آن بستگی دارد.

تصویر مفهومی از ساختار کروماتین، که مناطق DNA متراکم و با آرایش سست را نشان می‌دهد. — تصویر: ساختار کروماتین با نواحی متراکم و باز.

شکل کروماتین

تصویر کتاب درسی از یک کروموزوم (chromosome)—یکی از ۴۶ واحدی که ژنوم ما به آنها تقسیم شده است—یک خوشه فشرده و X شکل از کروماتین است. اما هر زمان که یک سلول به طور فعال تقسیم نمی‌شود، کروماتین آن به چیزی شبیه به یک گره درهم و برهم باز می‌شود. با این حال، در این هرج و مرج نظمی وجود دارد. برخی از قسمت‌های کروماتین به صورت متراکم در شکلی به نام هتروکروماتین (heterochromatin) بسته‌بندی شده‌اند. DNA فشرده در آنجا نسبتاً برای عوامل رونویسی غیرقابل دسترس است؛ ژن‌های موجود در آن معمولاً خاموش هستند. در همین حال، قسمت‌های دیگر نسبتاً شل، باز و قابل دسترس هستند: این را یوکروماتین (euchromatin) می‌نامند.

آنزیم‌های خاصی در بسته‌بندی و بازبسته‌بندی کروماتین (chromatin) نقش دارند و بدین ترتیب رونویسی (transcription) را کنترل می‌کنند. به عبارت دیگر، آنچه اهمیت دارد تنها اطلاعات کد شده در DNA نیست، بلکه نحوه وجود فیزیکی و پویا آن در فضا نیز مهم است. بیکمور می‌گوید: «ما دیگر ژنوم را به عنوان یک قطعه خطی از کد DNA نمی‌بینیم. فکر کردن به این تاخوردگی سه بعدی فوق‌العاده پویا به عنوان چیزی کاملاً ذاتی برای تنظیم، تغییر بسیار هیجان‌انگیزی است.»

یکی از جنبه‌های این سازماندهی سه بعدی، خوشه‌بندی بخش‌هایی از کروماتین به محفظه‌هایی به نام دامنه‌های مرتبط توپولوژیکی (TADs) است. در داخل یک TAD، ژن‌ها به نظر می‌رسد که به طور هم‌تنظیم شده (coregulated) هستند: به صورت گروهی روشن یا خاموش می‌شوند. چنین گروه‌هایی مجموعه‌هایی از ژن‌ها را فعال یا خاموش نگه می‌دارند تا در انواع مختلف سلول‌ها عملکرد ایجاد کرده و فراهم آورند. کوهزین (cohesin) نیز در جابجایی کروماتین برای ساخت TADs نقش دارد—یک فرآیند پویا که در آن کروماتین دائماً در سلول‌های ما بازآرایی می‌شود.

شکل کروماتین همچنین می‌تواند تحت تأثیر تغییرات شیمیایی به نام نشانه‌های اپی‌ژنتیک (epigenetic marks) قرار گیرد: مولکول‌های کوچکی که به پروتئین‌های بسته‌بندی DNA به نام هیستون‌ها (histones) متصل هستند یا مستقیماً به DNA چسبیده‌اند. برخی از این تغییرات اپی‌ژنتیک می‌توانند بارهای الکتریکی روی هیستون‌ها را تغییر دهند، که نحوه جذب یا دفع پروتئین‌ها را تغییر می‌دهد و بدین ترتیب بسته‌بندی کروماتین را بازآرایی می‌کند. تغییرات اپی‌ژنتیک در کروماتین مانند حاشیه‌نویسی‌های یک نوشته DNA هستند که معنای آن را در یک زمینه خاص تغییر می‌دهند. هنگامی که سلول‌ها تقسیم می‌شوند، حاشیه‌نویسی‌های اپی‌ژنتیک نیز کپی می‌شوند.

اینکه چگونه و چه زمانی این نشانه‌ها اضافه و تغییر می‌کنند، و هر نوع نشانه برای فعالیت ژن چه معنایی دارد، سؤالات پیچیده‌ای هستند که پاسخ‌های ساده‌ای ندارند. برخی از محققان از «کد اپی‌ژنتیک» صحبت می‌کنند که این جنبه از تنظیم ژن را کنترل می‌کند، اما هنوز مشخص نیست که آیا چنین سیستماتیک چیزی واقعاً وجود دارد یا خیر.

همه این فرآیندها و سایر موارد می‌توانند تعیین کنند که آیا یک ژن به mRNA رونویسی می‌شود یا خیر. اما لایه‌های دیگری از تنظیم وجود دارد که تعیین می‌کند آیا mRNA سپس به پروتئین مربوطه ترجمه می‌شود—و کدام پروتئین پدید می‌آید.

مداخلات RNA

این تنظیم پسارونویسی (post-transcriptional regulation) اغلب توسط مولکول‌های RNA کنترل می‌شود که غیرکدکننده (noncoding) نامیده می‌شوند. این مولکول‌های کوتاه‌عمر الگوهایی برای پروتئین‌ها نیستند، مانند mRNA، بلکه وظایف دیگری دارند. در حالی که mRNA از مناطق کدکننده پروتئین DNA (به اصطلاح «ژن‌های کدکننده») تولید می‌شود، RNA‌های غیرکدکننده (noncoding RNAs) از سایر مناطق DNA که اکنون عموماً به عنوان ژن‌های غیرکدکننده توصیف می‌شوند، رونویسی می‌گردند. این RNAهای غیرکدکننده بسیار متنوع هستند و نقش‌های متفاوتی در یک سلول ایفا می‌کنند. محققان هر روز بیشتر در مورد کارهایی که آنها می‌توانند انجام دهند یاد می‌گیرند، و بسیاری، اگر نه اکثر آنها، به نظر می‌رسد در تنظیم ژن نقش دارند.

به عنوان مثال، RNA‌های غیرکدکننده کوچکی به نام میکروRNA (microRNAs) می‌توانند mRNA‌ها را قبل از اینکه به پروتئین ترجمه شوند، خاموش کنند. آنها این کار را با هدایت آنزیم‌های خاص به یک mRNA خاص برای تخریب یا تغییر شیمیایی آن انجام می‌دهند. میکروRNA‌ها این کار را به تنهایی انجام نمی‌دهند، بلکه مانند عوامل رونویسی (transcription factors)، به صورت ترکیبی، در گروه‌ها و به شیوه‌ای نسبتاً نامنظم عمل می‌کنند: یک میکروRNA ممکن است چندین mRNA را تنظیم کند و یک mRNA ممکن است توسط چندین میکروRNA تنظیم شود.

چرا mRNA ساخته شود فقط برای اینکه از ترجمه آن به پروتئین جلوگیری شود؟ این نوع تنظیم پسارونویسی (post-transcriptional regulation) مانند داشتن یک نقطه بازرسی دیگر است: آیا سلول واقعاً به این پروتئین نیاز دارد؟ میکروRNA‌ها می‌توانند بسیج شوند تا به سلول‌ها اجازه دهند بیان ژن را بسته به زمینه فوری تنظیم کنند. به این ترتیب، عملکرد ژنوم کمتر شبیه پیشرفت اجتناب‌ناپذیر یک برنامه و بیشتر شبیه یک فرآیند انطباقی و پاسخگو است.

یک پیچیدگی دیگر پسارونویسی این است که mRNAها تنها پس از سازماندهی مجدد به پروتئین ترجمه می‌شوند. mRNA تازه از رونویسی (transcription)، توالی‌هایی را در خود دارد که قطعات پروتئینی به نام اگزون‌ها (exons) را کد می‌کنند، و همچنین توالی‌هایی را که نباید ترجمه شوند و باید حذف گردند، به نام اینترون‌ها (introns). (به طور دقیق‌تر، این RNA ویرایش‌نشده اولیه pre-mRNA نامیده می‌شود.) وظیفه حذف اینترون‌ها و اتصال اگزون‌ها به یکدیگر توسط یک مجموعه مولکولی به نام اسپلایسوزوم (spliceosome) انجام می‌شود که از چندین پروتئین همراه با RNA‌های غیرکدکننده مختلف ساخته شده است.

اسپلایسوزوم نیز می‌تواند به زمینه حساس باشد، به طوری که ممکن است pre-mRNA را ویرایش کند تا در یک نوع سلول یک پروتئین و در نوع دیگری پروتئین کمی متفاوت را کد کند. گاهی اوقات این «ایزوفورم‌های» پروتئینی (protein isoforms) می‌توانند نقش‌های بسیار متفاوتی داشته باشند. به عنوان مثال، عوامل رونویسی (transcription factors) اغلب به این روش به طور متناوب ویرایش می‌شوند، و ایزوفورم‌های آنها می‌توانند وظایف تنظیمی متفاوتی را بر عهده بگیرند—برخی ممکن است بیان ژن را فعال کنند، در حالی که برخی دیگر آن را سرکوب می‌کنند.

دیاگرامی که مکانیسم‌های تنظیمی مختلف در بیان ژن، از جمله عوامل رونویسی و RNA را نشان می‌دهد. — نمودار: مکانیسم‌های تنظیمی در بیان ژن، از جمله عوامل رونویسی و RNA.

کنترل‌ها و تعادل‌ها

با در نظر گرفتن همه اینها، این مکانیسم‌های تنظیمی و سایر موارد نشان می‌دهند که ژنوم (genome) به هیچ وجه یک برنامه خودکار نیست که در پس‌زمینه برای ساخت و زنده نگه داشتن ما اجرا شود. سلول‌های ما در واقع در مورد نحوه استفاده از ژن‌های خود—هم اطلاعاتی که حاوی آن هستند و هم ساختاری که فرض می‌کنند—تصمیمات پیچیده‌ای می‌گیرند.

بنابراین، سلول‌ها باید یک کمیته نسبتاً شل و مبهم از اجزا، مانند عوامل رونویسی (transcription factors) و تقویت‌کننده‌ها (enhancers)، را گرد هم آورند تا رونویسی (transcription) را آغاز کنند، که این نیز به شکل‌گیری و قالب‌گیری رشته کروماتین (chromatin) در آن لحظه بستگی دارد. سپس لایه‌های بیشتری از تصمیم‌گیری و اقدام بین mRNA و پروتئین نهایی و عملکردی وجود دارد.

به یاد داشته باشید که تمام اجزا—از عوامل رونویسی (transcription factors) گرفته تا RNA‌های غیرکدکننده (noncoding RNAs)—خودشان از ژنوم در همین نوع فرآیند وابسته به زمینه تولید می‌شوند. این امر ژنوم را به سیستمی بازگشتی و خودارجاعی (recursive, self-referential system) شبیه می‌کند که دانشمند علوم کامپیوتر داگلاس هافستاتر آن را «حلقه عجیب» نامید. این سیستم بر خودش عمل می‌کند، با توجه به تاریخچه خودش (که مثلاً شکل‌گیری کروماتین و نشانه‌گذاری‌های اپی‌ژنتیک را تعیین می‌کند) و با گوش دادن به پیام‌های درون و بیرون سلول. بنابراین، یک طرح اولیه نیست.

و به همین دلیل، درک آن اصلاً آسان نیست. بیکمور می‌گوید: «اگر من خدا بودم، آن را اینگونه طراحی نمی‌کردم. اما ما اینجا هستیم!»

چرا تنظیم ژن در حیواناتی مانند ما اینقدر لعنتی پیچیده است؟ یک پاسخ احتمالی این است که تکامل (evolution) آینده‌نگری لازم برای طراحی با کارایی و منطق شفاف را ندارد، بلکه صرفاً با آنچه قبلاً در دسترس دارد ور می‌رود. شاید چنین باشد—اما تنظیم ژن یوکاریوتی (eukaryotic gene regulation) فقط یک نسخه آشفته از آنچه در باکتری‌ها اتفاق می‌افتد نیست. اصول متفاوتی دارد، و قطعاً دلیلی برای آنها وجود دارد.

بیکمور گمان می‌کند که پیچیدگی تنظیم و سازماندهی ژنوم ممکن است تنها راه برای ایجاد پیچیدگی در موجود زنده بوده باشد. به عنوان مثال، موجودات دارای انواع بافت‌های متعدد و سبک‌های زندگی متنوع، نیاز به کنترل بیشتری بر روی اینکه کدام ژن‌ها در یک سلول خاص روشن یا خاموش باشند، داشتند. یکی از چیزهایی که این امر طلب می‌کرد، توالی‌های تنظیمی غیرکدکننده (noncoding regulatory sequences) بیشتر و بیشتری در DNA بود. اما پس از آن، همه آنها نمی‌توانستند نزدیک خود ژن جا شوند.

بیکمور می‌گوید: «هرچه پیچیدگی بیشتری پیدا می‌کنید، نیاز به اضافه کردن تقویت‌کننده‌های (enhancers) بیشتر و بیشتری دارید. اما آنها را کجا می‌خواهید بگذارید؟ شروع می‌کنید به قرار دادن آنها دورتر و دورتر. هنگامی که آنها [به اندازه کافی دور] هستند، نیاز به TADs و تاخوردگی سه بعدی [کروماتین] پیدا می‌کنید تا امکان عملکرد آنها فراهم شود.»

ما همچنین به پیچیدگی تنظیمی نیاز داریم زیرا، در طول زمان تکاملی، ژنوم انسان DNA ویروس‌های انگلی را به شکل ماده ژنتیکی پرش‌کننده به نام عناصر ترانسپوزون (transposable elements) انباشته کرده است. این توالی‌ها خود را در سراسر کروموزوم‌های ما وارد کرده‌اند و در تکثیر خود مهارت دارند. برای جداسازی DNA خوب از بد، ما به لایه‌های اضافی از تنظیم نیاز داشتیم تا اطمینان حاصل کنیم که سلول‌ها RNA‌هایی را ترجمه نمی‌کنند که واقعاً به آنها نیاز ندارند یا ممکن است فعالانه مضر باشند.

با وجود این همه کنترل‌ها و تعادل‌های وابسته به زمینه در عملکرد ژنوم ما، آشکار است که این یک برنامه یا الگوریتم نیست که نتایج یکسانی را در هر موقعیت به طور قابل پیش‌بینی تولید کند. این یک سیستم اطلاعاتی باز است که به ورودی‌های خارجی و شرایط داخلی پویا ژنوم پاسخ می‌دهد. اگر AI صرفاً به توالی‌های ژنتیکی درون ژنوم‌ها برای پیش‌بینی عملکرد ژنوم‌ها تکیه کند، این امر چالشی را ایجاد می‌کند.

تصویری به سبک خاص که ماهیت پویا و انطباقی ژنوم انسان را نشان می‌دهد. — تصویر: ماهیت پویا و انطباقی ژنوم انسان.

«عضوی بسیار حساس»

محققانی که مدل‌های پایه ژنومی مبتنی بر هوش مصنوعی (AI) مانند AlphaGenome را توسعه می‌دهند، امیدوارند که همه این لایه‌های تنظیم—عوامل رونویسی (transcription factors)، اسپلایسینگ (splicing)، نشانه‌های اپی‌ژنتیک (epigenetic marks)، حلقه‌ها (loops)، بسته‌بندی کروماتین (chromatin packing) و غیره—به طور ضمنی در همبستگی‌هایی که الگوریتم‌ها بین توالی ژنتیکی و ویژگی‌های موجود زنده یاد می‌گیرند، گنجانده شوند. آنها راضی هستند که پیچیدگی‌های توصیف‌شده در بالا در یک جعبه سیاه (black box) باشد، تا زمانی که مدل پیش‌بینی‌های دقیقی را تولید کند. اما آیا این کارایی خواهد داشت؟

بیکمور می‌گوید: «مطمئنم [AlphaGenome] مفید خواهد بود، اما با محدودیت‌هایی. به نظر من، شکاف بزرگ در پیچیدگی بدن انسان است—در همه انواع سلولی و چگونگی تغییر آنها در طول زمان در فرایند رشد. و تمام آن داده‌ها گم شده‌اند.»

اساساً، چالش این است که ژنوم مجموعه‌ای از دستورالعمل‌های ثابت و خطی نیست. بسیار پویا است و از اطلاعات خود به صورت زمینه‌ای، با منطق ترکیبی و نامنظم استفاده می‌کند. او می‌گوید: «آیا ما هرگز می‌توانیم آن جنبه را در الگوریتم‌هایی مانند AlphaGenome ثبت کنیم، نمی‌دانم.»

با این حال، مشکل حتی عمیق‌تر است، زیرا عملکرد موجودات خاص، از جمله هر یک از ما، تنها به ژنوم‌ها بستگی ندارد. عوامل دیگری مانند رژیم غذایی، محیط، میکروبیوم (microbiome) و حداقل برای ما، فرهنگ نیز می‌توانند اهمیت زیادی داشته باشند—نه فقط از نظر نحوه عملکرد ما و میزان سلامتی ما، بلکه در وضعیت خود ژنوم نیز. آدریان وولفسون، زیست‌شناس و یکی از بنیانگذاران شرکت بیوتکنولوژی Genyro مستقر در کالیفرنیا که هدفش استفاده از سیستم‌های هوش مصنوعی برای به اصطلاح «زیست‌شناسی تولیدی» (generative biology) است، این ابر اطلاعاتی را «انفورمیوم» (informiome) می‌نامد.

وولفسون در کتاب خود با عنوان درباره آینده گونه‌ها (On the Future of Species) که در آوریل ۲۰۲۶ منتشر شد، نوشت: «در حالی که ژنوم انسان اساس انفورمیوم (informiome) انسان را تشکیل می‌دهد، لایه‌های دیگر اطلاعات فراژنتیکی (extra-genetic information) نیز به همان اندازه مهم هستند.» او استدلال کرد که مدل‌های پایه ژنومی حتی قادر نخواهند بود تمام پیامدهای جهش‌های ژنتیکی را پیش‌بینی کنند، زیرا اطلاعات مربوطه از ابتدا در توالی ژنوم نیست.

پس چگونه باید به ژنوم فکر کنیم؟ شاید تنها استعاره‌هایی که می‌توانند نحوه عملکرد واقعی ژنوم را به تصویر بکشند، باید از خود زیست‌شناسی نشأت بگیرند. در سال ۲۰۲۰، اولین فاکس کلر، مورخ زیست‌شناسی، ژنوم را با «یک سیستم واکنش‌پذیر فوق‌العاده حساس» مقایسه کرد. او گفت که ژنوم به جای یک توالی ژنی که منجر به شکل‌گیری صفات می‌شود، بیشتر شبیه «ابزاری برای تنظیم تولید پروتئین‌های خاص در پاسخ به سیگنال‌های دائماً در حال تغییر است که از محیط خود دریافت می‌کند.»

این توصیف نزدیک به تصویری است که باربارا مک‌کلینتاک (Barbara McClintock)، ژنتیک‌دان، در سخنرانی خود هنگام دریافت جایزه نوبل فیزیولوژی یا پزشکی در سال ۱۹۸۳ برای کشف ترانسپوزون‌ها (transposons) ارائه داد. او اعلام کرد که ژنوم «یک عضو بسیار حساس سلول است که فعالیت‌های ژنومی را رصد کرده و خطاهای رایج را اصلاح می‌کند، رخدادهای غیرعادی و غیرمنتظره را حس می‌کند و به آنها پاسخ می‌دهد، اغلب با بازسازی ژنوم.»

تحقیقات از آن زمان تاکنون این تصویر را تکمیل کرده و نشان داده‌اند که شکل کروماتین (chromatin) می‌تواند به اندازه اطلاعاتی که توالی‌های DNA آن کد می‌کنند، اهمیت داشته باشد و چگونه ارتشی از مولکول‌ها برای بازسازی آن و اتخاذ تصمیمات جمعی در مورد نحوه استفاده از اطلاعات ژنتیکی آن به روش‌های وابسته به زمینه همکاری می‌کنند. هیچ فناوری انسانی‌ای به این شکل کار نمی‌کند، بنابراین استعاره‌هایی مانند طرح‌های اولیه، برنامه‌ها یا رایانه‌ها همیشه ناقص خواهند بود.

بیکمور خوشبین است که عملکرد ژنوم (genome) با وجود پیچیدگی‌هایش قابل درک است. او می‌گوید: «ما اکنون آن را درک کرده‌ایم. شاید جزئیات را ندانیم، اما فکر می‌کنم کل این حوزه اکنون در حال ادغام در چارچوبی است که در آن به روش‌های مشابهی فکر می‌کنیم.» هوش مصنوعی (AI) قطعاً می‌تواند در این درک کمک کند، اما در نهایت، برای تشخیص اصول بنیادی، به استدلال انسانی نیاز خواهد بود.

آدلمن می‌گوید: «مک‌کلینتاک بسیار دقیق‌تر از آنچه مردم در آن زمان تصور می‌کردند، بود. آنچه او گفت این بود که ژنوم ایستا نیست—بلکه زنده است.»

برچسب‌ها ژنوم انسان هوش مصنوعی تنظیم ژن DNA کروماتین اپی‌ژنتیک عوامل رونویسی تقویت‌کننده‌ها

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: مجله کوانتا