تصویرسازی: متا
تصویرسازی: متا

متا با انتشار لاما ۴، دو مدل جدید به هوش مصنوعی خود اضافه می‌کند

متا ادعا می‌کند مدل‌های جدیدش در طیف وسیعی از بنچمارک‌ها از مدل‌های OpenAI و گوگل برتر هستند.

تصویرسازی هنری لوگوی متا با تم هوش مصنوعی
تصویرسازی: متا

متا از انتشار لاما ۴ (Llama 4)، جدیدترین مجموعه مدل‌های هوش مصنوعی خود، خبر داد. این مدل‌ها اکنون قدرت‌بخش هوش مصنوعی متا (Meta AI) در وب و همچنین در واتس‌اپ، مسنجر و دایرکت اینستاگرام هستند. دو مدل جدید که هم‌اکنون برای دانلود از وب‌سایت متا یا Hugging Face در دسترس هستند، عبارتند از: لاما ۴ اسکاوت (Llama 4 Scout)، یک مدل کوچک که قادر است «در یک پردازنده گرافیکی انویدیا H100 جای گیرد»، و لاما ۴ ماوریک (Llama 4 Maverick) که بیشتر شبیه به GPT-4o و Gemini 2.0 Flash است. این شرکت همچنین اعلام کرد که در حال آموزش مدل لاما ۴ بِهِموت (Llama 4 Behemoth) است که به گفته مارک زاکربرگ، مدیرعامل متا، در اینستاگرام «در حال حاضر قدرتمندترین مدل پایه در جهان است.»

جدول مقایسه مشخصات مدل‌های لاما ۴
تصویر: متا

به گفته متا، مدل اسکاوت دارای یک پنجره زمینه (حافظه کاری یک مدل هوش مصنوعی) ۱۰ میلیون توکنی است و مدل‌های Gemma 3 گوگل و Gemini 2.0 Flash-Lite و همچنین مدل متن‌باز Mistral 3.1 را «در طیف گسترده‌ای از بنچمارک‌های متداول» شکست می‌دهد، در حالی که همچنان «در یک پردازنده گرافیکی انویدیا H100 جای می‌گیرد». این شرکت ادعاهای مشابهی در مورد عملکرد مدل بزرگ‌تر ماوریک در مقایسه با GPT-4o شرکت OpenAI و Gemini 2.0 Flash گوگل مطرح می‌کند و می‌گوید نتایج آن در وظایف کدنویسی و استدلال با DeepSeek-V3 قابل مقایسه است، در حالی که از «کمتر از نیمی از پارامترهای فعال» (متغیرهایی که رفتار مدل‌های هوش مصنوعی را هدایت می‌کنند) استفاده می‌کند.

در همین حال، لاما ۴ بهموت دارای ۲۸۸ میلیارد پارامتر فعال و در مجموع ۲ تریلیون پارامتر است. این شرکت مجدداً ادعا می‌کند که بهموت می‌تواند از رقبای خود، در این مورد GPT-4.5 و Claude Sonnet 3.7، «در چندین بنچمارک حوزه علوم، فناوری، مهندسی و ریاضیات (STEM)» عملکرد بهتری داشته باشد.

متا می‌گوید برای لاما ۴ به معماری «ترکیب متخصصان» (MoE) روی آورده است؛ رویکردی که با استفاده تنها از بخش‌های مورد نیاز مدل برای یک وظیفه خاص، منابع را حفظ می‌کند. این شرکت قصد دارد در رویداد لاما‌کان (LlamaCon) که در تاریخ ۲۹ آوریل (برابر با ۱۰ اردیبهشت) برگزار می‌شود، درباره برنامه‌های آینده خود برای مدل‌ها و محصولات هوش مصنوعی بحث کند.

مانند مدل‌های پیشین خود، متا مجموعه لاما ۴ را «متن‌باز» می‌نامد، اگرچه به دلیل الزامات کمتر باز مجوزهایش مورد انتقاد قرار گرفته است. به عنوان مثال، مجوز لاما ۴ از نهادهای تجاری با بیش از ۷۰۰ میلیون کاربر فعال ماهانه می‌خواهد که پیش از استفاده از مدل‌هایش، از متا مجوز درخواست کنند؛ موضوعی که ابتکار متن‌باز (Open Source Initiative) در سال ۲۰۲۳ نوشت که آن را «از دسته 'متن‌باز' خارج می‌کند».