اعتبار تصویر: Gabby Jones/Bloomberg / Getty Images
اعتبار تصویر: Gabby Jones/Bloomberg / Getty Images

xAI ایلان ماسک جدیدترین مدل پرچمدار خود، Grok 3 را منتشر کرد

شرکت هوش مصنوعی ایلان ماسک، xAI، اواخر روز دوشنبه جدیدترین مدل هوش مصنوعی پرچمدار خود، Grok 3 را منتشر کرد و از قابلیت‌های جدیدی برای برنامه‌های Grok iOS و وب رونمایی کرد.

Grok، پاسخ xAI به مدل‌هایی مانند GPT-4o اوپن‌ای‌آی و Gemini گوگل، می‌تواند تصاویر را تجزیه و تحلیل کند و به سوالات پاسخ دهد، و تعدادی از ویژگی‌ها را در شبکه اجتماعی ماسک، X، تقویت می‌کند. Grok 3، که چندین ماه در حال توسعه بوده است، به طور خوشبینانه‌ای برای انتشار در سال 2024 برنامه‌ریزی شده بود، اما از این مهلت مقرر جا ماند.

دوشنبه یک راه‌اندازی جاه‌طلبانه است.

xAI از یک مرکز داده عظیم در ممفیس حاوی حدود 200000 پردازنده گرافیکی برای آموزش Grok 3 استفاده کرده است. ماسک در یک پست در X ادعا کرد که Grok 3 با "10 برابر" قدرت محاسباتی بیشتر از نسخه قبلی خود، Grok 2، با استفاده از مجموعه داده آموزشی گسترده‌تری که ظاهراً شامل پرونده‌های قضایی است، توسعه یافته است.

xAI Grok 3
اعضای تیم xAI، از جمله ماسک (سمت راست دور)، در جریان یک ارائه زنده از Grok 3. اعتبار تصویر: xAI

ماسک در جریان یک ارائه زنده در روز دوشنبه گفت: «Grok 3 یک مرتبه تواناتر از Grok 2 است. [این یک] هوش مصنوعی حداکثر حقیقت‌جو است، حتی اگر این حقیقت گاهی اوقات با آنچه از نظر سیاسی صحیح است در تضاد باشد.»

Grok 3 به طور دقیق‌تر یک خانواده از مدل‌ها است. یک نسخه کوچکتر از Grok 3، Grok 3 mini، با هزینه کردن مقداری از دقت، سریع‌تر به سوالات پاسخ می‌دهد. همه مدل‌ها و ویژگی‌های مرتبط Grok 3 هنوز در دسترس نیستند (برخی در مرحله بتا هستند)، اما از روز دوشنبه شروع به عرضه شدند.

xAI ادعا می‌کند که Grok 3 در بنچمارک‌هایی از جمله AIME (که عملکرد یک مدل را در نمونه‌گیری از سوالات ریاضی ارزیابی می‌کند) و GPQA (که مدل‌ها را با استفاده از مسائل فیزیک، زیست‌شناسی و شیمی در سطح دکترا ارزیابی می‌کند) از GPT-4o پیشی می‌گیرد. به گفته xAI، یک نسخه اولیه از Grok 3 نیز در Chatbot Arena، یک آزمون جمع‌سپاری که مدل‌های مختلف هوش مصنوعی را در مقابل یکدیگر قرار می‌دهد و از کاربران می‌خواهد به پاسخ‌های ترجیحی خود رای دهند، به طور رقابتی امتیاز کسب کرد.

xAI Grok 3
اعتبار تصویر: xAI

دو مدل در خانواده جدید Grok 3، Grok 3 Reasoning و Grok 3 mini Reasoning، می‌توانند با دقت در مورد مسائل «فکر کنند»، شبیه به مدل‌های «استدلال» مانند o3-mini اوپن‌ای‌آی و R1 شرکت هوش مصنوعی چینی DeepSeek. مدل‌های استدلال سعی می‌کنند قبل از ارائه نتایج، خودشان را بررسی کنند، که به آنها کمک می‌کند از برخی از دام‌هایی که معمولاً مدل‌ها را به دام می‌اندازند، اجتناب کنند.

xAI ادعا می‌کند که Grok 3 Reasoning از بهترین نسخه o3-mini — o3-mini-high — در چندین بنچمارک محبوب، از جمله یک بنچمارک جدیدتر ریاضی به نام AIME 2025 پیشی می‌گیرد.

xAI Grok 3
اعتبار تصویر: xAI

این مدل‌های استدلال از طریق برنامه Grok قابل دسترسی هستند. کاربران می‌توانند از Grok 3 بخواهند که «فکر کند»، یا — برای پرسش‌های دشوارتر — از حالت «مغز بزرگ» برای استدلالی که از محاسبات بیشتری استفاده می‌کند، استفاده کنند. xAI مدل‌های استدلال را به عنوان مناسب‌ترین برای سوالات ریاضی، علمی و برنامه‌نویسی توصیف می‌کند.

ماسک گفت برخی از "افکار" مدل‌های استدلال در برنامه Grok مبهم شده‌اند تا از تقطیر، روشی که توسط توسعه‌دهندگان مدل هوش مصنوعی برای استخراج دانش از سایر مدل‌ها استفاده می‌شود، جلوگیری شود. اخیراً DeepSeek متهم به تقطیر مدل‌های OpenAI برای ایجاد مدل‌های خود شد.

مدل‌های استدلال Grok زیربنای یک ویژگی جدید در برنامه Grok به نام DeepSearch هستند، پاسخ xAI به ابزارهای تحقیقاتی مبتنی بر هوش مصنوعی مانند تحقیقات عمیق OpenAI. DeepSearch اینترنت و X را اسکن می‌کند تا اطلاعات را تجزیه و تحلیل کند و در پاسخ به یک سوال، خلاصه‌ای ارائه دهد.

مشترکین سطح Premium+ X (50 دلار در ماه) ابتدا به Grok 3 دسترسی خواهند داشت، و سایر ویژگی‌ها پشت یک طرح جدید که xAI آن را SuperGrok می‌نامد، قفل خواهند شد. SuperGrok با قیمت 30 دلار در ماه یا 300 دلار در سال (اگر نشت‌ها باور کردنی باشند)، استدلال اضافی و پرسش‌های DeepSearch را باز می‌کند و تولید تصویر نامحدود را ارائه می‌دهد.

xAI Grok 3
اعتبار تصویر: xAI

ماسک گفت در آینده - به زودی حدود یک هفته دیگر - برنامه Grok یک "حالت صوتی" به دست خواهد آورد که به مدل‌های Grok صدای مصنوعی می‌دهد. چند هفته پس از آن، مدل‌های Grok 3 از طریق API سازمانی xAI، همراه با قابلیت DeepSearch، در دسترس خواهند بود.

ماسک گفت xAI قصد دارد Grok 2 را در ماه‌های آینده به صورت متن‌باز منتشر کند.

او ادامه داد: «رویکرد کلی ما این است که آخرین نسخه [Grok] را زمانی که نسخه بعدی به طور کامل منتشر شد، متن‌باز کنیم. زمانی که Grok 3 بالغ و پایدار باشد، که احتمالاً ظرف چند ماه خواهد بود، Grok 2 را متن‌باز خواهیم کرد.»

زمانی که ماسک تقریباً دو سال پیش Grok را معرفی کرد، این مدل هوش مصنوعی را به عنوان یک مدل تند و تیز، فیلتر نشده و ضد "بیداری" معرفی کرد - به طور کلی، مایل به پاسخگویی به سوالات بحث‌برانگیزی که سایر سیستم‌های هوش مصنوعی پاسخ نمی‌دهند. او به برخی از این وعده‌ها عمل کرد. برای مثال، اگر به Grok و Grok 2 گفته شود که مبتذل باشند، با خوشحالی موظف می‌شدند و زبان رنگارنگی را به زبان می‌آوردند که احتمالاً از ChatGPT نخواهید شنید.

اما مدل‌های Grok قبل از Grok 3 در مورد موضوعات سیاسی مانور می‌دادند و از مرزهای خاصی عبور نمی‌کردند. در واقع، یک مطالعه نشان داد که Grok در موضوعاتی مانند حقوق تراجنسیتی‌ها، برنامه‌های تنوع و نابرابری به سمت چپ سیاسی گرایش دارد.

ماسک این رفتار را به داده‌های آموزشی Grok - صفحات وب عمومی - نسبت داده است و متعهد شده است که "Grok را به سمت بی‌طرفی سیاسی نزدیک‌تر کند." هنوز مشخص نیست که آیا xAI به این هدف دست یافته است یا خیر، و پیامدهای آن چه خواهد بود.