گوگل روز چهارشنبه اعلام کرد که مدل زبان بزرگ هوش مصنوعی Gemini 2.0 خود را تغییر داده است تا فرضیههای علمی جدیدی را در کسری از زمان صرف شده توسط تیمهای محققان آزمایشگاهی تولید کند.
این شرکت نسخه "دانشمند همکار هوش مصنوعی" جمینی را به عنوان "پیشرفتی امیدوارکننده به سوی فناوریهای کمکرسان هوش مصنوعی برای دانشمندان برای کمک به تسریع کشف" و برنامهای که قرار است با یک انسان "در حلقه" اجرا شود، معرفی میکند تا "به عنوان یک دستیار و همکار مفید برای دانشمندان عمل کند و به تسریع روند کشف علمی کمک کند."
همچنین: هوش مصنوعی جمینی 2.0 گوگل وعده میدهد از طریق پیشرفتهای عاملی سریعتر و هوشمندتر باشد
همچنین نمایشی از این است که چگونه مدلهای هوش مصنوعی به اصطلاح استدلالی اکنون استفاده از منابع محاسباتی را بالاتر و بالاتر میبرند تا مرجعدهی متقابل، ارزیابی، رتبهبندی، مرتبسازی، غربالگری و انجام بسیاری از کارهای دیگر را انجام دهند - همه پس از اینکه کاربر درخواست را تایپ کرده است.
در یک ترکیب جسورانه از انتشار علمی و بازاریابی، محققان گوگل یک مقاله فنی منتشر کردند که فرضیهای را که توسط دانشمند همکار تولید شده بود، همزمان با مقالهای که توسط گروهی از دانشمندان انسانی در امپریال کالج لندن منتشر شده بود، با همان فرضیه، شرح میداد.
گوگل ادعا میکند که فرضیه دانشمند همکار، در مورد روش خاصی که باکتریها برای ایجاد عوامل بیماریزای جدید تکامل مییابند، دو روز طول کشید تا تولید شود، در حالی که کار تولید شده توسط انسان نتیجه یک دهه مطالعه و کار آزمایشگاهی بوده است.
ماشین فرمولبندی فرضیه
گوگل این ماشین را به عنوان یک ماشین فرمولبندی فرضیه توصیف میکند که از چندین عامل استفاده میکند.
با توجه به هدف تحقیقاتی یک دانشمند که به زبان طبیعی مشخص شده است، دانشمند همکار هوش مصنوعی برای تولید فرضیههای تحقیقاتی جدید، یک نمای کلی دقیق از تحقیقات و پروتکلهای تجربی طراحی شده است. برای انجام این کار، از ائتلافی از عوامل تخصصی استفاده میکند: تولید، بازتاب، رتبهبندی، تکامل، مجاورت و بررسی متا.
دانشمند همکار پس از اینکه دانشمند هدف تحقیقاتی خود را "همراه با ترجیحات، محدودیتهای آزمایش و سایر ویژگیها" در درخواست تایپ کرد، شروع به کار میکند.
گوگل اصرار دارد که این برنامه فراتر از صرفاً بررسی متون میرود تا در عوض "دانش جدید و اصلی را کشف کند و فرضیهها و پیشنهادات تحقیقاتی جدیدی را به طور ملموس فرمولبندی کند، که بر اساس شواهد قبلی ساخته شده و متناسب با اهداف تحقیقاتی خاص است."
مقیاسبندی زمان آزمایش روی استروئیدها
اصلاح جمینی 2.0 بر استفاده از "مقیاسبندی زمان آزمایش" تأکید دارد، جایی که عوامل هوش مصنوعی از مقادیر فزایندهای از قدرت محاسباتی برای بررسی و فرمولبندی مجدد خروجی خود به صورت مکرر استفاده میکنند.
مقیاسبندی زمان آزمایش به طور چشمگیری نه تنها در جمینی، بلکه در مدل o1 OpenAI و DeepSeek AI نیز دیده شده است، همه نمونههایی از مدلهای به اصطلاح استدلالی که زمان بسیار بیشتری را صرف پاسخگویی به یک درخواست و تولید نتایج میانی میکنند.
دانشمند همکار هوش مصنوعی کمی از مقیاسبندی زمان آزمایش روی استروئیدها است.
همچنین: جمینی چیست؟ هر آنچه باید در مورد مدل هوش مصنوعی جدید گوگل بدانید
در مقاله رسمی که توسط Juraj Gottweis از گوگل نوشته شده و در سرور پیشچاپ arXiv ارسال شده است، نویسندگان به طور خاص کار خود را به عنوان نوعی ارتقاء از آنچه مدل R1 DeepSeek پیشگام آن بوده است، مرتبط میدانند:
"پیشرفتهای اخیر، مانند مدل DeepSeek-R1، پتانسیل محاسبات زمان آزمایش را با استفاده از یادگیری تقویتی برای اصلاح "زنجیره تفکر" مدل و افزایش تواناییهای استدلال پیچیده در افقهای طولانیتر نشان میدهد. در این کار، ما مقیاسبندی قابل توجهی از الگوی محاسبات زمان آزمایش را با استفاده از سوگیریهای استقرایی مشتق شده از روش علمی برای طراحی یک چارچوب چند عاملی برای استدلال علمی و تولید فرضیه بدون هیچ تکنیک یادگیری اضافی پیشنهاد میکنیم."
Gottweis و تیمش میگویند که دانشمند همکار از مجموعهای از عوامل هوش مصنوعی ساخته شده است که میتوانند به منابع خارجی دسترسی داشته باشند. آنها مینویسند: "آنها همچنین مجهز به تعامل با ابزارهای خارجی، مانند موتورهای جستجوی وب و مدلهای هوش مصنوعی تخصصی، از طریق رابطهای برنامهنویسی کاربردی هستند."
همچنین: تراکم چیست؟ راز DeepSeek AI، توسط محققان اپل فاش شد
جایی که مقیاسبندی زمان آزمایش بیشتر وارد عمل میشود، مفهوم "تورنمنت" است، جایی که دانشمند همکار فرضیههای متعددی را که تولید کرده است مقایسه و رتبهبندی میکند. این کار را با استفاده از امتیازهای "Elo" انجام میدهد، یک سیستم اندازهگیری رایج که برای رتبهبندی بازیکنان شطرنج و ورزشکاران استفاده میشود.
همانطور که Gottweis و تیمش آن را توصیف میکنند، یکی از عوامل، یک "عامل رتبهبندی"، مسئولیت اصلی رتبهبندی فرضیههای مختلف را به نوعی رقابتی بر عهده دارد:
یک انتزاع مهم در سیستم دانشمند همکار، مفهوم تورنمنت است که در آن پیشنهادات تحقیقاتی مختلف ارزیابی و رتبهبندی میشوند و امکان بهبودهای مکرر را فراهم میکنند. عامل رتبهبندی از یک تورنمنت مبتنی بر Elo برای ارزیابی و اولویتبندی فرضیههای تولید شده در هر زمان معین استفاده میکند و آن را سازماندهی میکند. این شامل مقایسههای زوجی است که با بحثهای علمی شبیهسازی شده تسهیل میشود، که امکان ارزیابی دقیق از مزایای نسبی هر پیشنهاد را فراهم میکند.
همچنین: DeepSeek AI چیست؟ آیا امن است؟ در اینجا هر آنچه باید بدانید آورده شده است
قرار است رتبهبندی باعث شود فرضیههای بهتر به بالای لیست برسند. همانطور که آنها میگویند، "این رتبهبندی به منظور انتقال یک لیست منظم از فرضیهها و پیشنهادات تحقیقاتی هماهنگ با هدف تحقیقاتی به دانشمندان است."
گوگل ادعا میکند که دادهها نشان میدهند که محاسبات بیشتر و بیشتر، و رتبهبندی و رتبهبندی مجدد، فرضیهها را به طور فزایندهای بهتر میکند، همانطور که توسط ناظران انسانی رتبهبندی شده است.
از مدلها و متخصصان انسانی بدون کمک فراتر میرود
به گفته پانزده متخصص انسانی که خروجی دانشمند همکار را بررسی کردند، این برنامه با صرف زمان محاسباتی بیشتر برای فرمولبندی فرضیهها و ارزیابی آنها بهتر میشود.
در این مقاله آمده است: "با صرف زمان بیشتر سیستم برای استدلال و بهبود، کیفیت خود رتبهبندی شده نتایج بهبود مییابد و از مدلها و متخصصان انسانی بدون کمک فراتر میرود."
ناظران انسانی به طور کلی به دانشمند همکار "پتانسیل بالاتری برای تازگی و تأثیرگذاری" دادند و "خروجیهای آن را در مقایسه با سایر مدلها" مانند جمینی 2.0 تغییر نیافته و مدل استدلال o1 OpenAI ترجیح دادند.
با توجه به تأکید بر مقیاسبندی تلاش محاسباتی، متأسفانه Gottweis و تیمش در هیچ کجای گزارش فنی 70 صفحهای خود ذکر نکردهاند که دقیقاً چه مقدار محاسبات برای دانشمند همکار هوش مصنوعی استفاده شده است.
با این حال، فرضیهای که آنها به اشتراک میگذارند این است که کاهش سریع در هزینه محاسبات از نوعی که DeepSeek R1 نشان میدهد، باید چیزی شبیه به دانشمند همکار را برای آزمایشگاههای تحقیقاتی به طور کلی قابل استفاده کند.
آنها خاطرنشان میکنند: "روندها با تقطیر و هزینههای محاسباتی زمان استنتاج نشان میدهد که چنین سیستمهای هوش مصنوعی هوشمند و عمومی به سرعت مقرون به صرفهتر و در دسترستر میشوند."