هنگامی که به سهم هوش مصنوعی در علم فکر میکنید، احتمالاً به AlphaFold، برنامه Google DeepMind برای پیشبینی ساختار پروتئین فکر میکنید که سال گذشته جایزه نوبل را برای سازندهاش به ارمغان آورد.
اکنون OpenAI میگوید که به بازی علم نیز وارد شده است – با مدلی برای مهندسی پروتئین.
این شرکت میگوید که یک مدل زبانی توسعه داده است که پروتئینهایی را طراحی میکند که قادر به تبدیل سلولهای معمولی به سلولهای بنیادی هستند – و اینکه به راحتی از انسانها در این کار پیشی گرفته است.
این کار اولین مدل OpenAI است که بر دادههای بیولوژیکی متمرکز شده و اولین ادعای عمومی آن است که مدلهایش میتوانند نتایج علمی غیرمنتظرهای ارائه دهند. به این ترتیب، گامی به سوی تعیین اینکه آیا هوش مصنوعی میتواند اکتشافات واقعی انجام دهد یا خیر، میباشد، که برخی استدلال میکنند که یک آزمون مهم در مسیر "هوش عمومی مصنوعی" است.
هفته گذشته، سم آلتمن، مدیرعامل OpenAI، گفت که "مطمئن" است که شرکتش میداند چگونه یک AGI بسازد و افزود که "ابزارهای فوق هوشمند میتوانند اکتشافات علمی و نوآوری را بسیار فراتر از آنچه که ما به تنهایی قادر به انجام آن هستیم، تسریع کنند."
پروژه مهندسی پروتئین یک سال پیش زمانی آغاز شد که Retro Biosciences، یک شرکت تحقیقاتی طول عمر مستقر در سان فرانسیسکو، به OpenAI در مورد همکاری پیشنهاد داد.
این ارتباط اتفاقی رخ نداد. سم آلتمن، مدیر عامل OpenAI، همانطور که MIT Technology Review برای اولین بار در سال 2023 گزارش داد، شخصاً 180 میلیون دلار به Retro کمک مالی کرد.
Retro هدف افزایش طول عمر طبیعی انسان را تا 10 سال دارد. برای این منظور، آنچه را که فاکتورهای یاماناکا نامیده میشوند، مطالعه میکند. این فاکتورها مجموعهای از پروتئینها هستند که وقتی به سلول پوست انسان اضافه میشوند، باعث میشوند که به یک سلول بنیادی جوان تبدیل شود، نوعی که میتواند هر بافت دیگری را در بدن تولید کند.
این پدیدهای است که محققان در Retro و در شرکتهای دارای بودجه هنگفت مانند Altos Labs، آن را نقطه شروع احتمالی برای جوانسازی حیوانات، ساخت اندامهای انسانی یا تأمین سلولهای جایگزین میدانند.
اما چنین "برنامهریزی مجدد" سلولی چندان کارآمد نیست. چندین هفته طول میکشد و کمتر از 1٪ از سلولهای تیمار شده در یک ظرف آزمایشگاهی، سفر جوانسازی را تکمیل میکنند.
مدل جدید OpenAI، به نام GPT-4b میکرو، برای پیشنهاد راههایی برای مهندسی مجدد فاکتورهای پروتئینی برای افزایش عملکرد آنها آموزش داده شد. به گفته OpenAI، محققان از پیشنهادات این مدل برای تغییر دو فاکتور یاماناکا استفاده کردند تا بیش از 50 برابر موثرتر باشند - حداقل بر اساس برخی معیارهای اولیه.
جان هلمن، محقق OpenAI میگوید: «در سراسر جهان، به نظر میرسد پروتئینها بهتر از آن چیزی هستند که دانشمندان توانستند خودشان تولید کنند.»
هلمن و آرون جائچ از OpenAI، و همچنین ریکو مینل از Retro، توسعه دهندگان اصلی این مدل بودند.
دانشمندان خارجی تا زمانی که نتایج منتشر نشوند، نمیتوانند بگویند که آیا نتایج واقعی هستند یا خیر، چیزی که شرکتها میگویند در حال برنامهریزی برای آن هستند. همچنین این مدل برای استفاده گستردهتر در دسترس نیست – این هنوز یک نمایش سفارشی است، نه یک راهاندازی رسمی محصول.
جائچ میگوید: «این پروژه برای نشان دادن این است که ما در مورد کمک به علم جدی هستیم.» «اما اینکه آیا این قابلیتها به عنوان یک مدل جداگانه به جهان عرضه میشوند یا اینکه در مدلهای استدلال اصلی ما ادغام میشوند – این هنوز مشخص نیست.»
این مدل به همان روشی که AlphaFold گوگل کار نمیکند، که پیشبینی میکند پروتئینها چه شکلی به خود میگیرند. از آنجایی که فاکتورهای یاماناکا پروتئینهای غیرمعمول شل و بدون ساختاری هستند، OpenAI گفت که آنها خواستار رویکرد متفاوتی بودند، که مدلهای زبانی بزرگ آن برای آن مناسب بودند.
این مدل بر روی نمونههایی از توالیهای پروتئینی از گونههای متعدد و همچنین اطلاعاتی در مورد اینکه کدام پروتئینها تمایل به تعامل با یکدیگر دارند، آموزش داده شد. در حالی که این مقدار زیادی داده است، تنها کسری از آن چیزی است که رباتهای گفتگوی پرچمدار OpenAI بر روی آن آموزش دیدهاند، که GPT-4b را به نمونهای از یک "مدل زبانی کوچک" تبدیل میکند که با یک مجموعه داده متمرکز کار میکند.
هنگامی که دانشمندان Retro این مدل را دریافت کردند، سعی کردند آن را هدایت کنند تا طراحیهای مجدد احتمالی پروتئینهای یاماناکا را پیشنهاد دهد. تاکتیک درخواست مورد استفاده شبیه به روش "چند شات" است، که در آن کاربر با ارائه مجموعهای از مثالها با پاسخ، و سپس مثالی برای پاسخ دادن ربات، از یک ربات گفتگو سؤال میکند.
اگرچه مهندسان ژنتیک راههایی برای هدایت تکامل مولکولها در آزمایشگاه دارند، اما معمولاً فقط میتوانند تعداد محدودی از احتمالات را آزمایش کنند. و حتی یک پروتئین با طول معمولی را میتوان به روشهای تقریباً نامحدودی تغییر داد (زیرا آنها از صدها اسید آمینه ساخته شدهاند و هر اسید در 20 نوع ممکن وجود دارد).
با این حال، مدل OpenAI اغلب پیشنهادهایی ارائه میدهد که در آن یک سوم اسیدهای آمینه در پروتئینها تغییر کردهاند.
جو بتس لاکروا، مدیر عامل Retro میگوید: «ما این مدل را بلافاصله به آزمایشگاه انداختیم و نتایج دنیای واقعی را به دست آوردیم.» او میگوید ایدههای این مدل به طور غیرمعمولی خوب بودند و در بخش قابل توجهی از موارد منجر به بهبودهایی نسبت به فاکتورهای اصلی یاماناکا شدند.
وادیم گلادیشف، محقق پیری دانشگاه هاروارد که با Retro مشاوره میکند، میگوید که راههای بهتری برای ساخت سلولهای بنیادی مورد نیاز است. او میگوید: «برای ما، این بسیار مفید خواهد بود. [سلولهای پوست] به راحتی قابل برنامهریزی مجدد هستند، اما سلولهای دیگر اینطور نیستند.» «و انجام آن در یک گونه جدید – اغلب بسیار متفاوت است و شما چیزی به دست نمیآورید.»
اینکه دقیقاً GPT-4b چگونه به حدسهای خود میرسد هنوز مشخص نیست – همانطور که اغلب در مورد مدلهای هوش مصنوعی اتفاق میافتد. بتس لاکروا میگوید: «این مانند زمانی است که AlphaGo بهترین انسان را در Go شکست داد، اما مدت زیادی طول کشید تا بفهمیم چرا.» «ما هنوز در حال کشف هستیم که چه کاری انجام میدهد، و فکر میکنیم روشی که ما از این استفاده میکنیم فقط خراش دادن سطح است.»
OpenAI میگوید هیچ پولی در این همکاری رد و بدل نشده است. اما از آنجایی که این کار میتواند به نفع Retro باشد – که بزرگترین سرمایهگذار آن آلتمن است – این اعلامیه ممکن است به سؤالات پیرامون پروژههای جانبی مدیر عامل OpenAI اضافه کند.
سال گذشته، وال استریت ژورنال گفت که سرمایهگذاریهای گسترده آلتمن در استارتآپهای فناوری خصوصی به یک "امپراتوری سرمایهگذاری مبهم" میرسد که "در حال ایجاد فهرستی فزاینده از تضادهای بالقوه" است، زیرا برخی از این شرکتها نیز با OpenAI تجارت میکنند.
در مورد Retro، صرفاً مرتبط بودن با آلتمن، OpenAI و مسابقه به سوی AGI میتواند مشخصات آن را افزایش دهد و توانایی آن را برای استخدام کارکنان و جمعآوری سرمایه افزایش دهد. بتس لاکروا به سؤالاتی در مورد اینکه آیا این شرکت در مراحل اولیه در حال حاضر در حالت جمعآوری سرمایه است، پاسخ نداد.
OpenAI میگوید که آلتمن مستقیماً در این کار دخالت نداشته و هرگز بر اساس سایر سرمایهگذاریهای آلتمن تصمیمگیری نمیکند.