روز سهشنبه، متا اولین کنفرانس توسعهدهندگان هوش مصنوعی LlamaCon خود را در مقر خود در منلو پارک برگزار میکند، جایی که این شرکت تلاش خواهد کرد توسعهدهندگان را برای ساخت برنامهها با مدلهای هوش مصنوعی باز لاما خود ترغیب کند. تنها یک سال پیش، این کار سختی نبود.
با این حال، در ماههای اخیر، متا در رقابت رو به رشد هوش مصنوعی، برای همگام شدن با آزمایشگاههای هوش مصنوعی "باز" مانند دیپسیک (DeepSeek) و رقبای تجاری "بسته" مانند OpenAI مشکل داشته است. LlamaCon در لحظه حساسی برای متا در تلاش آن برای ساخت اکوسیستم گسترده لاما برگزار میشود.
جذب توسعهدهندگان ممکن است به سادگی ارائه مدلهای باز بهتر باشد. اما این کار ممکن است دستیابی به آن دشوارتر از آنچه به نظر میرسد باشد.
شروع اولیه امیدوارکننده
عرضه Llama 4 توسط متا در اوایل این ماه، توسعهدهندگان را ناامید کرد و تعدادی از امتیازات بنچمارک آن کمتر از مدلهایی مانند R1 و V3 دیپسیک بود. این وضعیت با آنچه لاما قبلاً بود، یعنی مجموعهای از مدلهای پیشگام، فاصله زیادی داشت.
زمانی که متا مدل Llama 3.1 405B خود را تابستان گذشته عرضه کرد، مدیرعامل مارک زاکربرگ آن را یک پیروزی بزرگ اعلام کرد. در یک پست وبلاگی، متا Llama 3.1 405B را "توانمندترین مدل بنیادین به صورت باز" نامید که عملکردی قابل رقابت با بهترین مدل OpenAI در آن زمان، GPT-4o، داشت.
این یک مدل تأثیرگذار بود، و مدلهای دیگر خانواده Llama 3 متا نیز همینطور بودند. جرمی نیکسون، که در چند سال گذشته هکاتونهایی را در AGI House سانفرانسیسکو برگزار کرده است، عرضه Llama 3 را "لحظات تاریخی" نامید.
Llama 3 بدون شک متا را به یکی از محبوبترینها در میان توسعهدهندگان هوش مصنوعی تبدیل کرد و عملکرد پیشرفتهای را با آزادی میزبانی مدلها در هر کجا که انتخاب کنند، ارائه داد. جف بودیر، رئیس محصولات و رشد در Hugging Face، در مصاحبهای گفت که امروز مدل Llama 3.3 متا بیشتر از Llama 4 دانلود میشود.
این وضعیت را با استقبال از خانواده Llama 4 متا مقایسه کنید تا تفاوت آشکار شود. اما Llama 4 از همان ابتدا بحثبرانگیز بود.
بنچمارکهای فریبنده
متا یک نسخه از یکی از مدلهای Llama 4 خود، Llama 4 Maverick را برای "قابلیت گفتگو" بهینه کرد، که به آن کمک کرد تا در بنچمارک جمعسپاری شده LM Arena جایگاه بالایی را کسب کند. با این حال، متا هرگز این مدل را منتشر نکرد - نسخهای از Maverick که به طور گسترده عرضه شد، عملکرد بسیار بدتری در LM Arena داشت.
گروه پشت LM Arena گفت که متا باید "واضحتر" در مورد این اختلاف صحبت میکرد. ایون استویکا، یکی از بنیانگذاران LM Arena و استاد UC Berkeley که همچنین شرکتهایی مانند Anyscale و Databricks را بنیانگذاری کرده است، به TechCrunch گفت که این حادثه به اعتماد جامعه توسعهدهندگان به متا آسیب زده است.
استویکا در مصاحبهای با TechCrunch گفت: " [متا] باید بیشتر صریح میبود که مدل Maverick که در [LM Arena] بود، با مدلی که منتشر شد، متفاوت است." "وقتی این اتفاق میافتد، کمی از اعتماد با جامعه از بین میرود. البته، آنها میتوانند با انتشار مدلهای بهتر این اعتماد را بازگردانند."
عدم استدلال
یکی از نقاط ضعف آشکار خانواده Llama 4، عدم وجود مدل استدلالی هوش مصنوعی بود. مدلهای استدلالی میتوانند پیش از پاسخ دادن به سؤالات، با دقت آنها را بررسی کنند. در سال گذشته، بسیاری از صنعت هوش مصنوعی مدلهای استدلالی منتشر کردهاند که در بنچمارکهای خاص عملکرد بهتری دارند.
متا مدل استدلالی Llama 4 را معرفی کرده است، اما این شرکت اعلام نکرده است که چه زمانی باید انتظار آن را داشت.
ناتان لمبرت، پژوهشگر Ai2، میگوید این واقعیت که متا مدل استدلالی با Llama 4 منتشر نکرد، نشان میدهد که این شرکت ممکن است در عرضه عجله کرده باشد.
لمبرت گفت: "همه در حال انتشار مدل استدلالی هستند و این باعث میشود مدلهایشان خیلی خوب به نظر برسند." "چرا [متا] نتوانست برای این کار صبر کند؟ من پاسخ آن سؤال را نمیدانم. به نظر میرسد این اتفاقات عجیب معمول شرکتها است."
لمبرت خاطرنشان کرد که مدلهای باز رقیب اکنون بیش از هر زمان دیگری به مرز دانش نزدیکتر شدهاند و در اشکال و اندازههای بیشتری عرضه میشوند - این موضوع فشار بر متا را به شدت افزایش میدهد. به عنوان مثال، روز دوشنبه، علیبابا مجموعهای از مدلها، Qwen 3 را منتشر کرد که ظاهراً در Codeforces، یک بنچمارک برنامهنویسی، عملکردی بهتر از برخی از بهترین مدلهای کدنویسی OpenAI و گوگل دارند.
وظیفه متا
به گفته راوید شوارتز-زیو، پژوهشگر هوش مصنوعی در مرکز علوم داده NYU، برای بازپسگیری رهبری مدلهای باز، متا به سادگی باید مدلهای برتر را ارائه دهد. او به TechCrunch گفت که این ممکن است شامل ریسکپذیری بیشتر، مانند استفاده از تکنیکهای جدید باشد.
اینکه آیا متا در حال حاضر در موقعیتی است که بتواند ریسکهای بزرگ را بپذیرد، مشخص نیست. کارمندان فعلی و سابق قبلاً به Fortune گفته بودند که آزمایشگاه تحقیقاتی هوش مصنوعی متا در حال "مرگ تدریجی" است. جوئل پینو، معاون تحقیقات هوش مصنوعی این شرکت، این ماه اعلام کرد که قصد ترک شرکت را دارد.
LlamaCon فرصتی برای متا است تا نشان دهد چه چیزی برای شکست دادن نسخههای آتی آزمایشگاههای هوش مصنوعی مانند OpenAI، گوگل، xAI و دیگران آماده کرده است. اگر در ارائه موفق نباشد، این شرکت ممکن است در این فضای بسیار رقابتی بیشتر عقب بیفتد.