معرفی Command A: حداکثر کارایی، حداقل هزینه محاسباتی (از طریق) انتشار جدید LLM از Cohere. جالب است که کدام جنبههای مدل را برجسته میکنند، به عنوان نشانهای از آنچه مشتریان تجاری آنها بیشترین ارزش را برای آن قائل هستند (تأکید از من است):
فرمان A حداکثر کارایی را با حداقل هزینههای سختافزاری در مقایسه با مدلهای پیشرو اختصاصی و دارای وزن باز، مانند GPT-4o و DeepSeek-V3 ارائه میدهد. برای استقرارهای خصوصی، فرمان A در وظایف عاملمحور و چندزبانه حیاتی برای کسبوکار عالی عمل میکند، در حالی که فقط روی دو GPU قابل استقرار است، در مقایسه با سایر مدلهایی که معمولاً به 32 عدد نیاز دارند.
این مدل دارای وزنهای باز است اما به هیچ وجه متنباز نیست - مجوز آن Creative Commons Attribution Non-Commercial است و همچنین مستلزم رعایت سیاست استفاده قابل قبول آنها است.
کوهیر آن را برای استفاده تجاری از طریق قیمتگذاری "تماس با ما" یا از طریق API خود ارائه میدهد. من llm-command-r 0.3 را منتشر کردم که از این مدل جدید، به همراه Command R7B کوچکتر و سریعتر آنها (منتشر شده در دسامبر) و پشتیبانی از خروجیهای ساختاریافته از طریق طرحوارههای LLM پشتیبانی میکند.
(من یک باگ عجیب در پشتیبانی از طرحواره آنها پیدا کردم که در آن طرحوارههایی که به یک عدد صحیح ختم میشوند، یک عدد صحیح به ظاهر نامحدود را خروجی میدهند - در آزمایشهای من، این باگ روی Command R و Command A جدید تأثیر گذاشت، اما روی Command R7B تأثیر نگذاشت.)