گوگل روز چهارشنبه Gemma 3 را، تکرار بعدی در خانواده مدلهای متنباز Gemma، معرفی کرد. این مدل جانشین مدل Gemma 2 است که سال گذشته منتشر شد.
این مدل کوچک در اندازههای مختلف پارامتر - 1B، 4B، 12B و 27B - ارائه میشود. این مدل همچنین از یک پنجره context طولانیتر با 128K توکن پشتیبانی میکند. این مدل میتواند فیلمها، تصاویر و متن را تجزیه و تحلیل کند، از 35 زبان به صورت پیشفرض پشتیبانی میکند و پشتیبانی از پیشآموزشدیده برای 140 زبان را فراهم میکند.
در Chatbot Arena، مدل Gemma 3 27B از مدلهای DeepSeek-V3، o3-mini OpenAI و Llama 3-405B متا پیشی گرفت. مدلها در Chatbot Arena از طریق ارزیابیهای کنار هم توسط انسانها در برابر یکدیگر ارزیابی میشوند.
علاوه بر این، مدل Gemma 3 27B در معیارهای استاندارد مانند MMLU-Pro به ترتیب 67.5٪ و 42.4٪ امتیاز کسب کرد. این مدل در مقایسه با سایر مدلهای کوچک در رقابت عملکرد خوبی دارد.
Claude 3.5 Haiku در معیار MMLU-Pro امتیاز 63٪ و در GPQA Diamond امتیاز 41٪ کسب کرد، در حالی که GPT-4o Mini OpenAI در همین آزمونها به ترتیب 65٪ و 43٪ به دست آورد. Llama 3.3 70B متا از هر دو پیشی گرفت و با 71٪ در MMLU-Pro و 50٪ در GPQA Diamond، به قویترین رقیب در بین این مدلها تبدیل شد.
با این حال، به نظر میرسد که قدرت کلیدی Gemma-3 استفاده کارآمد از محاسبات باشد. گوگل گفت که Gemma 3 27B این امتیازات را با یک GPU NVIDIA H100 به دست آورده است، در حالی که سایر مدلها به حداکثر 32 GPU نیاز داشتند.
این شرکت همچنین فاش کرد که معماری مدل برای کاهش حافظه KV-cache اصلاح شده است، که با context طولانیتر افزایش مییابد.
گوگل گزارش فنی مفصلی را منتشر کرده است که تکنیکهای مورد استفاده برای ساخت مدل، عملکرد و سایر مشخصات آن را شرح میدهد. Gemma 3 از طریق روشهای مختلف قابل دسترسی است. گوگل این مدل را در وب با استفاده از Google AI Studio، از طریق چتبات پیشفرض یا API ارائه میدهد و همچنین در Google GenAI SDK نیز موجود است.
علاوه بر این، این مدل را میتوان برای استقرار محلی در Hugging Face، Ollama و Kaggle دانلود کرد.
همراه با Gemma 3، گوگل همچنین ShieldGemma 2 را نیز راهاندازی کرده است، یک بررسیکننده ایمنی تصویر با پارامتر 4B که بر اساس پایه Gemma 3 ساخته شده است. این مدل برچسبهای ایمنی را برای تصاویر مضر که شامل محتوای خطرناک، صریح جنسی و خشونتآمیز هستند، ارائه میدهد.