مارک زاکربرگ، مدیر عامل شرکت متا پلتفرمز، در رویداد متا کانکت در منلو پارک، کالیفرنیا، ایالات متحده، روز چهارشنبه، ۲۵ سپتامبر ۲۰۲۴.
مارک زاکربرگ، مدیر عامل شرکت متا پلتفرمز، در رویداد متا کانکت در منلو پارک، کالیفرنیا، ایالات متحده، روز چهارشنبه، ۲۵ سپتامبر ۲۰۲۴.

متا برای جذب توسعه‌دهندگان هوش مصنوعی به اولین LlamaCon خود نیاز دارد

روز سه‌شنبه، متا اولین کنفرانس توسعه‌دهندگان هوش مصنوعی LlamaCon خود را در مقر خود در منلو پارک برگزار می‌کند، جایی که این شرکت تلاش خواهد کرد توسعه‌دهندگان را برای ساخت برنامه‌ها با مدل‌های هوش مصنوعی باز لاما خود ترغیب کند. تنها یک سال پیش، این کار سختی نبود.

با این حال، در ماه‌های اخیر، متا در رقابت رو به رشد هوش مصنوعی، برای همگام شدن با آزمایشگاه‌های هوش مصنوعی "باز" مانند دیپ‌سیک (DeepSeek) و رقبای تجاری "بسته" مانند OpenAI مشکل داشته است. LlamaCon در لحظه حساسی برای متا در تلاش آن برای ساخت اکوسیستم گسترده لاما برگزار می‌شود.

جذب توسعه‌دهندگان ممکن است به سادگی ارائه مدل‌های باز بهتر باشد. اما این کار ممکن است دستیابی به آن دشوارتر از آنچه به نظر می‌رسد باشد.

شروع اولیه امیدوارکننده

عرضه Llama 4 توسط متا در اوایل این ماه، توسعه‌دهندگان را ناامید کرد و تعدادی از امتیازات بنچمارک آن کمتر از مدل‌هایی مانند R1 و V3 دیپ‌سیک بود. این وضعیت با آنچه لاما قبلاً بود، یعنی مجموعه‌ای از مدل‌های پیشگام، فاصله زیادی داشت.

زمانی که متا مدل Llama 3.1 405B خود را تابستان گذشته عرضه کرد، مدیرعامل مارک زاکربرگ آن را یک پیروزی بزرگ اعلام کرد. در یک پست وبلاگی، متا Llama 3.1 405B را "توانمندترین مدل بنیادین به صورت باز" نامید که عملکردی قابل رقابت با بهترین مدل OpenAI در آن زمان، GPT-4o، داشت.

این یک مدل تأثیرگذار بود، و مدل‌های دیگر خانواده Llama 3 متا نیز همین‌طور بودند. جرمی نیکسون، که در چند سال گذشته هکاتون‌هایی را در AGI House سانفرانسیسکو برگزار کرده است، عرضه Llama 3 را "لحظات تاریخی" نامید.

Llama 3 بدون شک متا را به یکی از محبوب‌ترین‌ها در میان توسعه‌دهندگان هوش مصنوعی تبدیل کرد و عملکرد پیشرفته‌ای را با آزادی میزبانی مدل‌ها در هر کجا که انتخاب کنند، ارائه داد. جف بودیر، رئیس محصولات و رشد در Hugging Face، در مصاحبه‌ای گفت که امروز مدل Llama 3.3 متا بیشتر از Llama 4 دانلود می‌شود.

این وضعیت را با استقبال از خانواده Llama 4 متا مقایسه کنید تا تفاوت آشکار شود. اما Llama 4 از همان ابتدا بحث‌برانگیز بود.

بنچمارک‌های فریبنده

متا یک نسخه از یکی از مدل‌های Llama 4 خود، Llama 4 Maverick را برای "قابلیت گفتگو" بهینه کرد، که به آن کمک کرد تا در بنچمارک جمع‌سپاری شده LM Arena جایگاه بالایی را کسب کند. با این حال، متا هرگز این مدل را منتشر نکرد - نسخه‌ای از Maverick که به طور گسترده عرضه شد، عملکرد بسیار بدتری در LM Arena داشت.

گروه پشت LM Arena گفت که متا باید "واضح‌تر" در مورد این اختلاف صحبت می‌کرد. ایون استویکا، یکی از بنیان‌گذاران LM Arena و استاد UC Berkeley که همچنین شرکت‌هایی مانند Anyscale و Databricks را بنیان‌گذاری کرده است، به TechCrunch گفت که این حادثه به اعتماد جامعه توسعه‌دهندگان به متا آسیب زده است.

استویکا در مصاحبه‌ای با TechCrunch گفت: " [متا] باید بیشتر صریح می‌بود که مدل Maverick که در [LM Arena] بود، با مدلی که منتشر شد، متفاوت است." "وقتی این اتفاق می‌افتد، کمی از اعتماد با جامعه از بین می‌رود. البته، آنها می‌توانند با انتشار مدل‌های بهتر این اعتماد را بازگردانند."

عدم استدلال

یکی از نقاط ضعف آشکار خانواده Llama 4، عدم وجود مدل استدلالی هوش مصنوعی بود. مدل‌های استدلالی می‌توانند پیش از پاسخ دادن به سؤالات، با دقت آن‌ها را بررسی کنند. در سال گذشته، بسیاری از صنعت هوش مصنوعی مدل‌های استدلالی منتشر کرده‌اند که در بنچمارک‌های خاص عملکرد بهتری دارند.

متا مدل استدلالی Llama 4 را معرفی کرده است، اما این شرکت اعلام نکرده است که چه زمانی باید انتظار آن را داشت.

ناتان لمبرت، پژوهشگر Ai2، می‌گوید این واقعیت که متا مدل استدلالی با Llama 4 منتشر نکرد، نشان می‌دهد که این شرکت ممکن است در عرضه عجله کرده باشد.

لمبرت گفت: "همه در حال انتشار مدل استدلالی هستند و این باعث می‌شود مدل‌هایشان خیلی خوب به نظر برسند." "چرا [متا] نتوانست برای این کار صبر کند؟ من پاسخ آن سؤال را نمی‌دانم. به نظر می‌رسد این اتفاقات عجیب معمول شرکت‌ها است."

لمبرت خاطرنشان کرد که مدل‌های باز رقیب اکنون بیش از هر زمان دیگری به مرز دانش نزدیک‌تر شده‌اند و در اشکال و اندازه‌های بیشتری عرضه می‌شوند - این موضوع فشار بر متا را به شدت افزایش می‌دهد. به عنوان مثال، روز دوشنبه، علی‌بابا مجموعه‌ای از مدل‌ها، Qwen 3 را منتشر کرد که ظاهراً در Codeforces، یک بنچمارک برنامه‌نویسی، عملکردی بهتر از برخی از بهترین مدل‌های کدنویسی OpenAI و گوگل دارند.

وظیفه متا

به گفته راوید شوارتز-زیو، پژوهشگر هوش مصنوعی در مرکز علوم داده NYU، برای بازپس‌گیری رهبری مدل‌های باز، متا به سادگی باید مدل‌های برتر را ارائه دهد. او به TechCrunch گفت که این ممکن است شامل ریسک‌پذیری بیشتر، مانند استفاده از تکنیک‌های جدید باشد.

اینکه آیا متا در حال حاضر در موقعیتی است که بتواند ریسک‌های بزرگ را بپذیرد، مشخص نیست. کارمندان فعلی و سابق قبلاً به Fortune گفته بودند که آزمایشگاه تحقیقاتی هوش مصنوعی متا در حال "مرگ تدریجی" است. جوئل پینو، معاون تحقیقات هوش مصنوعی این شرکت، این ماه اعلام کرد که قصد ترک شرکت را دارد.

LlamaCon فرصتی برای متا است تا نشان دهد چه چیزی برای شکست دادن نسخه‌های آتی آزمایشگاه‌های هوش مصنوعی مانند OpenAI، گوگل، xAI و دیگران آماده کرده است. اگر در ارائه موفق نباشد، این شرکت ممکن است در این فضای بسیار رقابتی بیشتر عقب بیفتد.