شرکت هوش مصنوعی ایلان ماسک، xAI، اواخر روز دوشنبه جدیدترین مدل هوش مصنوعی پرچمدار خود، Grok 3 را منتشر کرد و از قابلیتهای جدیدی برای برنامههای Grok iOS و وب رونمایی کرد.
Grok، پاسخ xAI به مدلهایی مانند GPT-4o اوپنایآی و Gemini گوگل، میتواند تصاویر را تجزیه و تحلیل کند و به سوالات پاسخ دهد، و تعدادی از ویژگیها را در شبکه اجتماعی ماسک، X، تقویت میکند. Grok 3، که چندین ماه در حال توسعه بوده است، به طور خوشبینانهای برای انتشار در سال 2024 برنامهریزی شده بود، اما از این مهلت مقرر جا ماند.
دوشنبه یک راهاندازی جاهطلبانه است.
xAI از یک مرکز داده عظیم در ممفیس حاوی حدود 200000 پردازنده گرافیکی برای آموزش Grok 3 استفاده کرده است. ماسک در یک پست در X ادعا کرد که Grok 3 با "10 برابر" قدرت محاسباتی بیشتر از نسخه قبلی خود، Grok 2، با استفاده از مجموعه داده آموزشی گستردهتری که ظاهراً شامل پروندههای قضایی است، توسعه یافته است.
ماسک در جریان یک ارائه زنده در روز دوشنبه گفت: «Grok 3 یک مرتبه تواناتر از Grok 2 است. [این یک] هوش مصنوعی حداکثر حقیقتجو است، حتی اگر این حقیقت گاهی اوقات با آنچه از نظر سیاسی صحیح است در تضاد باشد.»
Grok 3 به طور دقیقتر یک خانواده از مدلها است. یک نسخه کوچکتر از Grok 3، Grok 3 mini، با هزینه کردن مقداری از دقت، سریعتر به سوالات پاسخ میدهد. همه مدلها و ویژگیهای مرتبط Grok 3 هنوز در دسترس نیستند (برخی در مرحله بتا هستند)، اما از روز دوشنبه شروع به عرضه شدند.
xAI ادعا میکند که Grok 3 در بنچمارکهایی از جمله AIME (که عملکرد یک مدل را در نمونهگیری از سوالات ریاضی ارزیابی میکند) و GPQA (که مدلها را با استفاده از مسائل فیزیک، زیستشناسی و شیمی در سطح دکترا ارزیابی میکند) از GPT-4o پیشی میگیرد. به گفته xAI، یک نسخه اولیه از Grok 3 نیز در Chatbot Arena، یک آزمون جمعسپاری که مدلهای مختلف هوش مصنوعی را در مقابل یکدیگر قرار میدهد و از کاربران میخواهد به پاسخهای ترجیحی خود رای دهند، به طور رقابتی امتیاز کسب کرد.
دو مدل در خانواده جدید Grok 3، Grok 3 Reasoning و Grok 3 mini Reasoning، میتوانند با دقت در مورد مسائل «فکر کنند»، شبیه به مدلهای «استدلال» مانند o3-mini اوپنایآی و R1 شرکت هوش مصنوعی چینی DeepSeek. مدلهای استدلال سعی میکنند قبل از ارائه نتایج، خودشان را بررسی کنند، که به آنها کمک میکند از برخی از دامهایی که معمولاً مدلها را به دام میاندازند، اجتناب کنند.
xAI ادعا میکند که Grok 3 Reasoning از بهترین نسخه o3-mini — o3-mini-high — در چندین بنچمارک محبوب، از جمله یک بنچمارک جدیدتر ریاضی به نام AIME 2025 پیشی میگیرد.
این مدلهای استدلال از طریق برنامه Grok قابل دسترسی هستند. کاربران میتوانند از Grok 3 بخواهند که «فکر کند»، یا — برای پرسشهای دشوارتر — از حالت «مغز بزرگ» برای استدلالی که از محاسبات بیشتری استفاده میکند، استفاده کنند. xAI مدلهای استدلال را به عنوان مناسبترین برای سوالات ریاضی، علمی و برنامهنویسی توصیف میکند.
ماسک گفت برخی از "افکار" مدلهای استدلال در برنامه Grok مبهم شدهاند تا از تقطیر، روشی که توسط توسعهدهندگان مدل هوش مصنوعی برای استخراج دانش از سایر مدلها استفاده میشود، جلوگیری شود. اخیراً DeepSeek متهم به تقطیر مدلهای OpenAI برای ایجاد مدلهای خود شد.
مدلهای استدلال Grok زیربنای یک ویژگی جدید در برنامه Grok به نام DeepSearch هستند، پاسخ xAI به ابزارهای تحقیقاتی مبتنی بر هوش مصنوعی مانند تحقیقات عمیق OpenAI. DeepSearch اینترنت و X را اسکن میکند تا اطلاعات را تجزیه و تحلیل کند و در پاسخ به یک سوال، خلاصهای ارائه دهد.
مشترکین سطح Premium+ X (50 دلار در ماه) ابتدا به Grok 3 دسترسی خواهند داشت، و سایر ویژگیها پشت یک طرح جدید که xAI آن را SuperGrok مینامد، قفل خواهند شد. SuperGrok با قیمت 30 دلار در ماه یا 300 دلار در سال (اگر نشتها باور کردنی باشند)، استدلال اضافی و پرسشهای DeepSearch را باز میکند و تولید تصویر نامحدود را ارائه میدهد.
ماسک گفت در آینده - به زودی حدود یک هفته دیگر - برنامه Grok یک "حالت صوتی" به دست خواهد آورد که به مدلهای Grok صدای مصنوعی میدهد. چند هفته پس از آن، مدلهای Grok 3 از طریق API سازمانی xAI، همراه با قابلیت DeepSearch، در دسترس خواهند بود.
ماسک گفت xAI قصد دارد Grok 2 را در ماههای آینده به صورت متنباز منتشر کند.
او ادامه داد: «رویکرد کلی ما این است که آخرین نسخه [Grok] را زمانی که نسخه بعدی به طور کامل منتشر شد، متنباز کنیم. زمانی که Grok 3 بالغ و پایدار باشد، که احتمالاً ظرف چند ماه خواهد بود، Grok 2 را متنباز خواهیم کرد.»
زمانی که ماسک تقریباً دو سال پیش Grok را معرفی کرد، این مدل هوش مصنوعی را به عنوان یک مدل تند و تیز، فیلتر نشده و ضد "بیداری" معرفی کرد - به طور کلی، مایل به پاسخگویی به سوالات بحثبرانگیزی که سایر سیستمهای هوش مصنوعی پاسخ نمیدهند. او به برخی از این وعدهها عمل کرد. برای مثال، اگر به Grok و Grok 2 گفته شود که مبتذل باشند، با خوشحالی موظف میشدند و زبان رنگارنگی را به زبان میآوردند که احتمالاً از ChatGPT نخواهید شنید.
اما مدلهای Grok قبل از Grok 3 در مورد موضوعات سیاسی مانور میدادند و از مرزهای خاصی عبور نمیکردند. در واقع، یک مطالعه نشان داد که Grok در موضوعاتی مانند حقوق تراجنسیتیها، برنامههای تنوع و نابرابری به سمت چپ سیاسی گرایش دارد.
ماسک این رفتار را به دادههای آموزشی Grok - صفحات وب عمومی - نسبت داده است و متعهد شده است که "Grok را به سمت بیطرفی سیاسی نزدیکتر کند." هنوز مشخص نیست که آیا xAI به این هدف دست یافته است یا خیر، و پیامدهای آن چه خواهد بود.