فرمان A: حداکثر کارایی، حداقل محاسبات

معرفی Command A: حداکثر کارایی، حداقل هزینه محاسباتی (از طریق) انتشار جدید LLM از Cohere. جالب است که کدام جنبه‌های مدل را برجسته می‌کنند، به عنوان نشانه‌ای از آنچه مشتریان تجاری آن‌ها بیشترین ارزش را برای آن قائل هستند (تأکید از من است):

فرمان A حداکثر کارایی را با حداقل هزینه‌های سخت‌افزاری در مقایسه با مدل‌های پیشرو اختصاصی و دارای وزن باز، مانند GPT-4o و DeepSeek-V3 ارائه می‌دهد. برای استقرارهای خصوصی، فرمان A در وظایف عامل‌محور و چندزبانه حیاتی برای کسب‌وکار عالی عمل می‌کند، در حالی که فقط روی دو GPU قابل استقرار است، در مقایسه با سایر مدل‌هایی که معمولاً به 32 عدد نیاز دارند.

این مدل دارای وزن‌های باز است اما به هیچ وجه متن‌باز نیست - مجوز آن Creative Commons Attribution Non-Commercial است و همچنین مستلزم رعایت سیاست استفاده قابل قبول آنها است.

کوهیر آن را برای استفاده تجاری از طریق قیمت‌گذاری "تماس با ما" یا از طریق API خود ارائه می‌دهد. من llm-command-r 0.3 را منتشر کردم که از این مدل جدید، به همراه Command R7B کوچک‌تر و سریع‌تر آنها (منتشر شده در دسامبر) و پشتیبانی از خروجی‌های ساختاریافته از طریق طرحواره‌های LLM پشتیبانی می‌کند.

(من یک باگ عجیب در پشتیبانی از طرحواره آنها پیدا کردم که در آن طرحواره‌هایی که به یک عدد صحیح ختم می‌شوند، یک عدد صحیح به ظاهر نامحدود را خروجی می‌دهند - در آزمایش‌های من، این باگ روی Command R و Command A جدید تأثیر گذاشت، اما روی Command R7B تأثیر نگذاشت.)

https://simonwillison.net/2025/Mar/13/command-a/#atom-everything