Grok 3 Mini با کاهش هزینه‌ها، آتش جنگ قیمت هوش مصنوعی را تندتر می‌کند

جدول مقایسه: مدل‌های هوش مصنوعی با قیمت‌ها و نمرات عملکرد در معیارهایی از جمله AIME، GPQA، LiveCodeBench و MMLU-Pro.
Grok 3 Mini عملکرد معیار قوی را با هزینه‌های کم ترکیب می‌کند و در ریاضیات (AIME 2024) نمره برتر 93٪ را کسب می‌کند و به طور مداوم نتایج خوبی را در سراسر معیارها به دست می‌آورد | تصویر: xAI
نمودار پراکندگی: مدل‌های هوش مصنوعی که بر اساس شاخص هوش تحلیل مصنوعی و قیمت ترسیم شده‌اند، Grok 3 mini در ربع بهینه سبز رنگ برجسته شده است.
Grok 3 Mini شاخص هوش تقریباً 67 را با هزینه کم ارائه می‌دهد. | تصویر: Artificial Analysis

xAI با انتشار جدیدترین مدل زبانی خود، Grok 3 Mini، فشاری بر هوش مصنوعی کارآمد وارد می‌کند. هر دو مدل Grok 3 و مدل Mini از طریق xAI API در دسترس هستند.

خانواده Grok 3 در حال حاضر شامل شش نوع است: Grok 3، Grok 3 Fast و چهار نسخه از Grok 3 Mini—که در نسخه‌های کند و سریع، هر کدام با ظرفیت استدلال کم یا زیاد در دسترس هستند.

به گفته xAI، مدل Grok 3 Mini به طور خاص برای سرعت و مقرون به صرفه بودن ساخته شده است و در عین حال دارای یک فرآیند استدلال یکپارچه است—که تمایز قابل توجهی از Grok 3 بزرگتر دارد که بدون استدلال صریح عمل می‌کند.

xAI ادعا می‌کند که Grok 3 Mini در صدر نتایج جدول امتیازات در معیارهای ریاضی، برنامه‌نویسی و علوم در سطح کالج قرار دارد—در حالی که تا پنج برابر ارزان‌تر از سایر مدل‌های استدلال است. xAI می‌گوید با وجود اندازه کوچکتر، حتی از مدل‌های شاخص گران‌تر در چندین زمینه عملکرد بهتری دارد.

فشار بر قیمت‌گذاری در فضای هوش مصنوعی کاهش نمی‌یابد—به ویژه پس از کاهش هزینه اخیر گوگل با Gemini 2.5 Flash. Grok 3 Mini فقط آتش را تندتر می‌کند.

یکی از ویژگی‌های قابل توجه: xAI یک ردیابی کامل استدلال را با هر پاسخ API ارسال می‌کند. این به منظور ارائه شفافیت بیشتر به توسعه‌دهندگان در رفتار مدل است، اگرچه همانطور که تحقیقات جاری نشان می‌دهد، این به ظاهر "فرایندهای فکری" گاهی اوقات می‌توانند گمراه‌کننده باشند.

در حالی که Grok 3 Mini افزودنی جدید به مجموعه مدل‌ها است، هر دو مدل Grok 3 و Mini اکنون از طریق xAI API در دسترس توسعه‌دهندگان هستند و با ادغام در زنجیره‌های ابزار تثبیت‌شده، روند پذیرش را تسهیل می‌کنند.

Grok 3 همچنان برای کارهای دشواری که نیاز به دانش عمیق جهانی و تخصص دامنه دارند، هدف قرار گرفته است، و xAI آن را قدرتمندترین مدل موجود بدون یک جزء استدلال اختصاصی می‌نامد.

معیارسنجی Grok 3 Mini

تیم Artificial Analysis معیارهای خانواده Grok 3 را تعیین کرد و Grok 3 Mini Reasoning (بالا) را به دلیل نسبت قیمت/عملکرد آن برجسته کرد. بر اساس "شاخص هوش تحلیل مصنوعی" آنها، Grok 3 Mini Reasoning (بالا) در واقع از مدل‌هایی مانند Deepseek R1 و Claude 3.7 Sonnet (بودجه استدلال 64k) بهتر عمل می‌کند—همه اینها در حالی است که مزیت هزینه زیادی را حفظ می‌کند.

نتایج در اینجا بر متریک "هوش" متمرکز است که شش معیار مختلف را ترکیب می‌کند. اگرچه یک تفکیک دقیق برای هر کدام در راه است—مانند همیشه—نمرات معیار لزوماً عملکرد دنیای واقعی را منعکس نمی‌کنند. مدل‌های کوچکتر به ویژه می‌توانند اعداد چشمگیری را ارائه دهند که همیشه به استفاده روزمره منتقل نمی‌شوند.

وقتی صحبت از سرعت خام می‌شود، Grok 3 از همتای Mini خود که بیشتر بر استدلال متمرکز است، پیشی می‌گیرد: در نقاط پایانی استاندارد، Grok 3 500 توکن را در حدود 9.5 ثانیه تولید می‌کند، در حالی که Grok 3 Mini Reasoning 27.4 ثانیه طول می‌کشد.

Artificial Analysis، Grok 3 و Grok 3 Mini Reasoning (بالا) را در پنج رتبه برتر دسته‌های مربوطه خود—غیر استدلالی و استدلالی—قرار می‌دهد و خاطرنشان می‌کند که xAI با این نسخه‌ها، خود را محکم در میان رهبران چشم‌انداز مدل هوش مصنوعی فعلی تثبیت کرده است.

خلاصه

  • xAI دو مدل زبانی جدید، Grok 3 و Grok 3 Mini را از طریق API خود معرفی می‌کند. Grok 3 Mini به گونه‌ای طراحی شده است که مقرون به صرفه باشد، دارای استدلال یکپارچه است و در معیارهای ریاضی و برنامه‌نویسی از مدل‌های گران‌تر عملکرد بهتری دارد.
  • Grok 3 برای کارهای پیچیده بدون استدلال بهینه شده است و پاسخ‌های سریع‌تری ارائه می‌دهد، در حالی که Grok 3 Mini پاسخ‌های قابل فهم‌تری را با یک ردیابی استدلال کامل ارائه می‌دهد. هر دو مدل از طریق xAI API قابل دسترسی هستند.
  • Artificial Analysis گزارش می‌دهد که Grok 3 Mini Reasoning (بالا) نسبت قیمت به عملکرد قوی ارائه می‌دهد و در شاخص هوش خود از مدل‌هایی مانند DeepSeek R1 و Claude 3.7 Sonnet بهتر عمل می‌کند و این کار را با قیمت‌های بسیار پایین‌تر انجام می‌دهد.

منابع

xAI از طریق X Artifical Analysis از طریق X