تصویری از مدل هوش مصنوعی Gemma 3
تصویری از مدل هوش مصنوعی Gemma 3

مدل جدید هوش مصنوعی گوگل از DeepSeek-V3 و o3-mini OpenAI پیشی می‌گیرد

Gemma 3 27B در Chatbot Arena رتبه بالایی دارد و تنها به یک GPU نیاز دارد، در حالی که سایرین به 32 GPU نیاز دارند.

نمودار مقایسه‌ای عملکرد مدل‌های مختلف هوش مصنوعی
منبع: گوگل

گوگل روز چهارشنبه Gemma 3 را، تکرار بعدی در خانواده مدل‌های متن‌باز Gemma، معرفی کرد. این مدل جانشین مدل Gemma 2 است که سال گذشته منتشر شد.

این مدل کوچک در اندازه‌های مختلف پارامتر - 1B، 4B، 12B و 27B - ارائه می‌شود. این مدل همچنین از یک پنجره context طولانی‌تر با 128K توکن پشتیبانی می‌کند. این مدل می‌تواند فیلم‌ها، تصاویر و متن را تجزیه و تحلیل کند، از 35 زبان به صورت پیش‌فرض پشتیبانی می‌کند و پشتیبانی از پیش‌آموزش‌دیده برای 140 زبان را فراهم می‌کند.

در Chatbot Arena، مدل Gemma 3 27B از مدل‌های DeepSeek-V3، o3-mini OpenAI و Llama 3-405B متا پیشی گرفت. مدل‌ها در Chatbot Arena از طریق ارزیابی‌های کنار هم توسط انسان‌ها در برابر یکدیگر ارزیابی می‌شوند.

علاوه بر این، مدل Gemma 3 27B در معیارهای استاندارد مانند MMLU-Pro به ترتیب 67.5٪ و 42.4٪ امتیاز کسب کرد. این مدل در مقایسه با سایر مدل‌های کوچک در رقابت عملکرد خوبی دارد.

Claude 3.5 Haiku در معیار MMLU-Pro امتیاز 63٪ و در GPQA Diamond امتیاز 41٪ کسب کرد، در حالی که GPT-4o Mini OpenAI در همین آزمون‌ها به ترتیب 65٪ و 43٪ به دست آورد. Llama 3.3 70B متا از هر دو پیشی گرفت و با 71٪ در MMLU-Pro و 50٪ در GPQA Diamond، به قوی‌ترین رقیب در بین این مدل‌ها تبدیل شد.

با این حال، به نظر می‌رسد که قدرت کلیدی Gemma-3 استفاده کارآمد از محاسبات باشد. گوگل گفت که Gemma 3 27B این امتیازات را با یک GPU NVIDIA H100 به دست آورده است، در حالی که سایر مدل‌ها به حداکثر 32 GPU نیاز داشتند.

این شرکت همچنین فاش کرد که معماری مدل برای کاهش حافظه KV-cache اصلاح شده است، که با context طولانی‌تر افزایش می‌یابد.

گوگل گزارش فنی مفصلی را منتشر کرده است که تکنیک‌های مورد استفاده برای ساخت مدل، عملکرد و سایر مشخصات آن را شرح می‌دهد. Gemma 3 از طریق روش‌های مختلف قابل دسترسی است. گوگل این مدل را در وب با استفاده از Google AI Studio، از طریق چت‌بات پیش‌فرض یا API ارائه می‌دهد و همچنین در Google GenAI SDK نیز موجود است.

علاوه بر این، این مدل را می‌توان برای استقرار محلی در Hugging Face، Ollama و Kaggle دانلود کرد.

همراه با Gemma 3، گوگل همچنین ShieldGemma 2 را نیز راه‌اندازی کرده است، یک بررسی‌کننده ایمنی تصویر با پارامتر 4B که بر اساس پایه Gemma 3 ساخته شده است. این مدل برچسب‌های ایمنی را برای تصاویر مضر که شامل محتوای خطرناک، صریح جنسی و خشونت‌آمیز هستند، ارائه می‌دهد.