ZDNET
ZDNET

دانشمند همکار هوش مصنوعی گوگل «مقیاس‌بندی زمان آزمایش» روی استروئیدها است. این به چه معنایی برای تحقیقات است؟

گوگل روز چهارشنبه اعلام کرد که مدل زبان بزرگ هوش مصنوعی Gemini 2.0 خود را تغییر داده است تا فرضیه‌های علمی جدیدی را در کسری از زمان صرف شده توسط تیم‌های محققان آزمایشگاهی تولید کند.

این شرکت نسخه "دانشمند همکار هوش مصنوعی" جمینی را به عنوان "پیشرفتی امیدوارکننده به سوی فناوری‌های کمک‌رسان هوش مصنوعی برای دانشمندان برای کمک به تسریع کشف" و برنامه‌ای که قرار است با یک انسان "در حلقه" اجرا شود، معرفی می‌کند تا "به عنوان یک دستیار و همکار مفید برای دانشمندان عمل کند و به تسریع روند کشف علمی کمک کند."

همچنین: هوش مصنوعی جمینی 2.0 گوگل وعده می‌دهد از طریق پیشرفت‌های عاملی سریع‌تر و هوشمندتر باشد

همچنین نمایشی از این است که چگونه مدل‌های هوش مصنوعی به اصطلاح استدلالی اکنون استفاده از منابع محاسباتی را بالاتر و بالاتر می‌برند تا مرجع‌دهی متقابل، ارزیابی، رتبه‌بندی، مرتب‌سازی، غربالگری و انجام بسیاری از کارهای دیگر را انجام دهند - همه پس از اینکه کاربر درخواست را تایپ کرده است.

google-2025-ai-co-scientis-overview
دانشمند همکار هوش مصنوعی گوگل قرار است "انسانی در حلقه" داشته باشد که عملیات مختلف دستگاه مانند بررسی متون و فرمول‌بندی فرضیه‌ها را هدایت کند. گوگل

در یک ترکیب جسورانه از انتشار علمی و بازاریابی، محققان گوگل یک مقاله فنی منتشر کردند که فرضیه‌ای را که توسط دانشمند همکار تولید شده بود، همزمان با مقاله‌ای که توسط گروهی از دانشمندان انسانی در امپریال کالج لندن منتشر شده بود، با همان فرضیه، شرح می‌داد.

گوگل ادعا می‌کند که فرضیه دانشمند همکار، در مورد روش خاصی که باکتری‌ها برای ایجاد عوامل بیماری‌زای جدید تکامل می‌یابند، دو روز طول کشید تا تولید شود، در حالی که کار تولید شده توسط انسان نتیجه یک دهه مطالعه و کار آزمایشگاهی بوده است.

ماشین فرمول‌بندی فرضیه

گوگل این ماشین را به عنوان یک ماشین فرمول‌بندی فرضیه توصیف می‌کند که از چندین عامل استفاده می‌کند.

با توجه به هدف تحقیقاتی یک دانشمند که به زبان طبیعی مشخص شده است، دانشمند همکار هوش مصنوعی برای تولید فرضیه‌های تحقیقاتی جدید، یک نمای کلی دقیق از تحقیقات و پروتکل‌های تجربی طراحی شده است. برای انجام این کار، از ائتلافی از عوامل تخصصی استفاده می‌کند: تولید، بازتاب، رتبه‌بندی، تکامل، مجاورت و بررسی متا.

google-2025-aicoscientist-1-components-width-1250.png
طراحی گوگل برای دانشمند همکار هوش مصنوعی به این صورت است که یک فرد هدف تحقیقاتی را در درخواست وارد می‌کند، پس از آن مجموعه‌ای از عوامل به موازات هم برای بررسی متون، فرمول‌بندی و ارزیابی فرضیه‌ها کار می‌کنند. گوگل
google-2025-aicoscientist-2-overview-width-1250.png
ساختار دانشمند همکار هوش مصنوعی برای انجام وظایف چند عاملی به موازات هم طراحی شده است، که توسط یک عملکرد مدیریت حافظه برای ذخیره نتایج میانی پشتیبانی می‌شود. گوگل

دانشمند همکار پس از اینکه دانشمند هدف تحقیقاتی خود را "همراه با ترجیحات، محدودیت‌های آزمایش و سایر ویژگی‌ها" در درخواست تایپ کرد، شروع به کار می‌کند.

گوگل اصرار دارد که این برنامه فراتر از صرفاً بررسی متون می‌رود تا در عوض "دانش جدید و اصلی را کشف کند و فرضیه‌ها و پیشنهادات تحقیقاتی جدیدی را به طور ملموس فرمول‌بندی کند، که بر اساس شواهد قبلی ساخته شده و متناسب با اهداف تحقیقاتی خاص است."

مقیاس‌بندی زمان آزمایش روی استروئیدها

اصلاح جمینی 2.0 بر استفاده از "مقیاس‌بندی زمان آزمایش" تأکید دارد، جایی که عوامل هوش مصنوعی از مقادیر فزاینده‌ای از قدرت محاسباتی برای بررسی و فرمول‌بندی مجدد خروجی خود به صورت مکرر استفاده می‌کنند.

مقیاس‌بندی زمان آزمایش به طور چشمگیری نه تنها در جمینی، بلکه در مدل o1 OpenAI و DeepSeek AI نیز دیده شده است، همه نمونه‌هایی از مدل‌های به اصطلاح استدلالی که زمان بسیار بیشتری را صرف پاسخگویی به یک درخواست و تولید نتایج میانی می‌کنند.

دانشمند همکار هوش مصنوعی کمی از مقیاس‌بندی زمان آزمایش روی استروئیدها است.

همچنین: جمینی چیست؟ هر آنچه باید در مورد مدل هوش مصنوعی جدید گوگل بدانید

در مقاله رسمی که توسط Juraj Gottweis از گوگل نوشته شده و در سرور پیش‌چاپ arXiv ارسال شده است، نویسندگان به طور خاص کار خود را به عنوان نوعی ارتقاء از آنچه مدل R1 DeepSeek پیشگام آن بوده است، مرتبط می‌دانند:

"پیشرفت‌های اخیر، مانند مدل DeepSeek-R1، پتانسیل محاسبات زمان آزمایش را با استفاده از یادگیری تقویتی برای اصلاح "زنجیره تفکر" مدل و افزایش توانایی‌های استدلال پیچیده در افق‌های طولانی‌تر نشان می‌دهد. در این کار، ما مقیاس‌بندی قابل توجهی از الگوی محاسبات زمان آزمایش را با استفاده از سوگیری‌های استقرایی مشتق شده از روش علمی برای طراحی یک چارچوب چند عاملی برای استدلال علمی و تولید فرضیه بدون هیچ تکنیک یادگیری اضافی پیشنهاد می‌کنیم."

Gottweis و تیمش می‌گویند که دانشمند همکار از مجموعه‌ای از عوامل هوش مصنوعی ساخته شده است که می‌توانند به منابع خارجی دسترسی داشته باشند. آنها می‌نویسند: "آنها همچنین مجهز به تعامل با ابزارهای خارجی، مانند موتورهای جستجوی وب و مدل‌های هوش مصنوعی تخصصی، از طریق رابط‌های برنامه‌نویسی کاربردی هستند."

همچنین: تراکم چیست؟ راز DeepSeek AI، توسط محققان اپل فاش شد

جایی که مقیاس‌بندی زمان آزمایش بیشتر وارد عمل می‌شود، مفهوم "تورنمنت" است، جایی که دانشمند همکار فرضیه‌های متعددی را که تولید کرده است مقایسه و رتبه‌بندی می‌کند. این کار را با استفاده از امتیازهای "Elo" انجام می‌دهد، یک سیستم اندازه‌گیری رایج که برای رتبه‌بندی بازیکنان شطرنج و ورزشکاران استفاده می‌شود.

همانطور که Gottweis و تیمش آن را توصیف می‌کنند، یکی از عوامل، یک "عامل رتبه‌بندی"، مسئولیت اصلی رتبه‌بندی فرضیه‌های مختلف را به نوعی رقابتی بر عهده دارد:

یک انتزاع مهم در سیستم دانشمند همکار، مفهوم تورنمنت است که در آن پیشنهادات تحقیقاتی مختلف ارزیابی و رتبه‌بندی می‌شوند و امکان بهبودهای مکرر را فراهم می‌کنند. عامل رتبه‌بندی از یک تورنمنت مبتنی بر Elo برای ارزیابی و اولویت‌بندی فرضیه‌های تولید شده در هر زمان معین استفاده می‌کند و آن را سازماندهی می‌کند. این شامل مقایسه‌های زوجی است که با بحث‌های علمی شبیه‌سازی شده تسهیل می‌شود، که امکان ارزیابی دقیق از مزایای نسبی هر پیشنهاد را فراهم می‌کند.

همچنین: DeepSeek AI چیست؟ آیا امن است؟ در اینجا هر آنچه باید بدانید آورده شده است

قرار است رتبه‌بندی باعث شود فرضیه‌های بهتر به بالای لیست برسند. همانطور که آنها می‌گویند، "این رتبه‌بندی به منظور انتقال یک لیست منظم از فرضیه‌ها و پیشنهادات تحقیقاتی هماهنگ با هدف تحقیقاتی به دانشمندان است."

گوگل ادعا می‌کند که داده‌ها نشان می‌دهند که محاسبات بیشتر و بیشتر، و رتبه‌بندی و رتبه‌بندی مجدد، فرضیه‌ها را به طور فزاینده‌ای بهتر می‌کند، همانطور که توسط ناظران انسانی رتبه‌بندی شده است.

از مدل‌ها و متخصصان انسانی بدون کمک فراتر می‌رود

به گفته پانزده متخصص انسانی که خروجی دانشمند همکار را بررسی کردند، این برنامه با صرف زمان محاسباتی بیشتر برای فرمول‌بندی فرضیه‌ها و ارزیابی آنها بهتر می‌شود.

google-2025-elo-ratings-for-ai-co-scientist
گوگل می‌گوید که دانشمند همکار هوش مصنوعی با افزایش بودجه محاسباتی، از کیفیت نسبی جمینی 2.0 ساده فراتر می‌رود و منجر به امتیازهای Elo بالاتر مانند شطرنج و ورزش می‌شود. گوگل

در این مقاله آمده است: "با صرف زمان بیشتر سیستم برای استدلال و بهبود، کیفیت خود رتبه‌بندی شده نتایج بهبود می‌یابد و از مدل‌ها و متخصصان انسانی بدون کمک فراتر می‌رود."

ناظران انسانی به طور کلی به دانشمند همکار "پتانسیل بالاتری برای تازگی و تأثیرگذاری" دادند و "خروجی‌های آن را در مقایسه با سایر مدل‌ها" مانند جمینی 2.0 تغییر نیافته و مدل استدلال o1 OpenAI ترجیح دادند.

با توجه به تأکید بر مقیاس‌بندی تلاش محاسباتی، متأسفانه Gottweis و تیمش در هیچ کجای گزارش فنی 70 صفحه‌ای خود ذکر نکرده‌اند که دقیقاً چه مقدار محاسبات برای دانشمند همکار هوش مصنوعی استفاده شده است.

با این حال، فرضیه‌ای که آنها به اشتراک می‌گذارند این است که کاهش سریع در هزینه محاسبات از نوعی که DeepSeek R1 نشان می‌دهد، باید چیزی شبیه به دانشمند همکار را برای آزمایشگاه‌های تحقیقاتی به طور کلی قابل استفاده کند.

آنها خاطرنشان می‌کنند: "روندها با تقطیر و هزینه‌های محاسباتی زمان استنتاج نشان می‌دهد که چنین سیستم‌های هوش مصنوعی هوشمند و عمومی به سرعت مقرون به صرفه‌تر و در دسترس‌تر می‌شوند."