سری لاما با استفاده از معماری پیشرفته ترکیب متخصصان (MoE) بازطراحی شده و به صورت بومی با قابلیت چندوجهی آموزش داده شده است. ما لاما ۴ اسکوت (Llama 4 Scout) و لاما ۴ ماوریک (Llama 4 Maverick) را منتشر میکنیم و پیشنمایشی از لاما ۴ بهیموت (Llama 4 Behemoth) ارائه میدهیم.
💡 لاما ۴ اسکوت بهترین مدل کوچک با ۱۷ میلیارد پارامتر فعال و ۱۶ متخصص است. فوقالعاده سریع، بومی چندوجهی و بسیار هوشمند است. به پنجره زمینه پیشرو در صنعت با بیش از ۱۰ میلیون توکن دست مییابد و همچنین میتواند روی یک GPU واحد اجرا شود!
🚀 لاما ۴ ماوریک بهترین مدل چندوجهی در کلاس خود است که GPT-4o و Gemini 2.0 Flash را در طیف گستردهای از بنچمارکهای گزارششده شکست میدهد، در حالی که نتایج قابل مقایسهای با DeepSeek v3 جدید در استدلال و کدنویسی کسب میکند - با کمتر از نیمی از پارامترهای فعال. این مدل بهترین نسبت عملکرد به هزینه را در کلاس خود ارائه میدهد و نسخه چت آزمایشی آن امتیاز ELO 1417 را در LMArena کسب کرده است. همچنین میتواند روی یک میزبان واحد اجرا شود!
🤯 پیشنمایش لاما ۴ بهیموت، قدرتمندترین مدل ما تاکنون و یکی از هوشمندترین LLMهای جهان. لاما ۴ بهیموت در چندین بنچمارک STEM از GPT4.5، Claude Sonnet 3.7 و Gemini 2.0 Pro عملکرد بهتری دارد. لاما ۴ بهیموت هنوز در حال آموزش است و ما هیجانزدهایم که جزئیات بیشتری درباره آن، حتی در حین پیشرفت، به اشتراک بگذاریم.
— احمد الدحله، معاون و رئیس هوش مصنوعی مولد در متا