xAI با انتشار جدیدترین مدل زبانی خود، Grok 3 Mini، فشاری بر هوش مصنوعی کارآمد وارد میکند. هر دو مدل Grok 3 و مدل Mini از طریق xAI API در دسترس هستند.
خانواده Grok 3 در حال حاضر شامل شش نوع است: Grok 3، Grok 3 Fast و چهار نسخه از Grok 3 Mini—که در نسخههای کند و سریع، هر کدام با ظرفیت استدلال کم یا زیاد در دسترس هستند.
به گفته xAI، مدل Grok 3 Mini به طور خاص برای سرعت و مقرون به صرفه بودن ساخته شده است و در عین حال دارای یک فرآیند استدلال یکپارچه است—که تمایز قابل توجهی از Grok 3 بزرگتر دارد که بدون استدلال صریح عمل میکند.
xAI ادعا میکند که Grok 3 Mini در صدر نتایج جدول امتیازات در معیارهای ریاضی، برنامهنویسی و علوم در سطح کالج قرار دارد—در حالی که تا پنج برابر ارزانتر از سایر مدلهای استدلال است. xAI میگوید با وجود اندازه کوچکتر، حتی از مدلهای شاخص گرانتر در چندین زمینه عملکرد بهتری دارد.
فشار بر قیمتگذاری در فضای هوش مصنوعی کاهش نمییابد—به ویژه پس از کاهش هزینه اخیر گوگل با Gemini 2.5 Flash. Grok 3 Mini فقط آتش را تندتر میکند.
یکی از ویژگیهای قابل توجه: xAI یک ردیابی کامل استدلال را با هر پاسخ API ارسال میکند. این به منظور ارائه شفافیت بیشتر به توسعهدهندگان در رفتار مدل است، اگرچه همانطور که تحقیقات جاری نشان میدهد، این به ظاهر "فرایندهای فکری" گاهی اوقات میتوانند گمراهکننده باشند.
در حالی که Grok 3 Mini افزودنی جدید به مجموعه مدلها است، هر دو مدل Grok 3 و Mini اکنون از طریق xAI API در دسترس توسعهدهندگان هستند و با ادغام در زنجیرههای ابزار تثبیتشده، روند پذیرش را تسهیل میکنند.
Grok 3 همچنان برای کارهای دشواری که نیاز به دانش عمیق جهانی و تخصص دامنه دارند، هدف قرار گرفته است، و xAI آن را قدرتمندترین مدل موجود بدون یک جزء استدلال اختصاصی مینامد.
معیارسنجی Grok 3 Mini
تیم Artificial Analysis معیارهای خانواده Grok 3 را تعیین کرد و Grok 3 Mini Reasoning (بالا) را به دلیل نسبت قیمت/عملکرد آن برجسته کرد. بر اساس "شاخص هوش تحلیل مصنوعی" آنها، Grok 3 Mini Reasoning (بالا) در واقع از مدلهایی مانند Deepseek R1 و Claude 3.7 Sonnet (بودجه استدلال 64k) بهتر عمل میکند—همه اینها در حالی است که مزیت هزینه زیادی را حفظ میکند.
نتایج در اینجا بر متریک "هوش" متمرکز است که شش معیار مختلف را ترکیب میکند. اگرچه یک تفکیک دقیق برای هر کدام در راه است—مانند همیشه—نمرات معیار لزوماً عملکرد دنیای واقعی را منعکس نمیکنند. مدلهای کوچکتر به ویژه میتوانند اعداد چشمگیری را ارائه دهند که همیشه به استفاده روزمره منتقل نمیشوند.
وقتی صحبت از سرعت خام میشود، Grok 3 از همتای Mini خود که بیشتر بر استدلال متمرکز است، پیشی میگیرد: در نقاط پایانی استاندارد، Grok 3 500 توکن را در حدود 9.5 ثانیه تولید میکند، در حالی که Grok 3 Mini Reasoning 27.4 ثانیه طول میکشد.
Artificial Analysis، Grok 3 و Grok 3 Mini Reasoning (بالا) را در پنج رتبه برتر دستههای مربوطه خود—غیر استدلالی و استدلالی—قرار میدهد و خاطرنشان میکند که xAI با این نسخهها، خود را محکم در میان رهبران چشمانداز مدل هوش مصنوعی فعلی تثبیت کرده است.
خلاصه
- xAI دو مدل زبانی جدید، Grok 3 و Grok 3 Mini را از طریق API خود معرفی میکند. Grok 3 Mini به گونهای طراحی شده است که مقرون به صرفه باشد، دارای استدلال یکپارچه است و در معیارهای ریاضی و برنامهنویسی از مدلهای گرانتر عملکرد بهتری دارد.
- Grok 3 برای کارهای پیچیده بدون استدلال بهینه شده است و پاسخهای سریعتری ارائه میدهد، در حالی که Grok 3 Mini پاسخهای قابل فهمتری را با یک ردیابی استدلال کامل ارائه میدهد. هر دو مدل از طریق xAI API قابل دسترسی هستند.
- Artificial Analysis گزارش میدهد که Grok 3 Mini Reasoning (بالا) نسبت قیمت به عملکرد قوی ارائه میدهد و در شاخص هوش خود از مدلهایی مانند DeepSeek R1 و Claude 3.7 Sonnet بهتر عمل میکند و این کار را با قیمتهای بسیار پایینتر انجام میدهد.