Cohere با مدل جدید Command A چند زبانه، شرکت‌های جهانی را هدف قرار می‌دهد - فقط به 2 GPU نیاز دارد

استارتاپ هوش مصنوعی کانادایی Cohere - که یکی از نویسندگان مقاله اصلی ترانسفورمر است که انقلاب مدل زبانی بزرگ (LLM) را در سال 2017 آغاز کرد - امروز Command A، جدیدترین مدل هوش مصنوعی مولد خود را که برای کاربردهای سازمانی طراحی شده است، رونمایی کرد.

Command A به عنوان جانشین Command-R که در مارس 2024 عرضه شد و Command R+ که پس از آن عرضه شد، بر تمرکز Cohere بر تولید تقویت شده با بازیابی (RAG)، استفاده از ابزارهای خارجی و کارایی هوش مصنوعی سازمانی - به ویژه با توجه به محاسبات و سرعت ارائه پاسخ ها - استوار است.

این امر آن را به یک گزینه جذاب برای شرکت‌هایی تبدیل می‌کند که به دنبال کسب مزیت هوش مصنوعی بدون ورشکستگی هستند و برای برنامه‌هایی که به پاسخ‌های سریع نیاز دارند - مانند امور مالی، بهداشت، پزشکی، علم و حقوق - مناسب است.

Command A با سرعت‌های بالاتر، الزامات سخت‌افزاری کمتر و قابلیت‌های چند زبانه گسترده‌تر، خود را به عنوان جایگزینی قوی برای مدل‌هایی مانند GPT-4o و DeepSeek-V3 معرفی می‌کند - LLM های کلاسیک، نه مدل‌های استدلالی جدید که اخیراً صنعت هوش مصنوعی را تحت تأثیر قرار داده‌اند.

برخلاف نسخه قبلی خود که از طول متن 128000 توکن پشتیبانی می‌کرد (با اشاره به میزان اطلاعاتی که LLM می‌تواند در یک تبادل ورودی/خروجی مدیریت کند، تقریباً معادل یک رمان 300 صفحه‌ای)، Command A طول متن را به 256000 توکن (معادل 600 صفحه متن) افزایش می‌دهد در حالی که کارایی کلی و آمادگی سازمانی را بهبود می‌بخشد.

این مدل همچنین پس از آن عرضه می‌شود که Cohere for AI - زیرمجموعه غیرانتفاعی این شرکت - یک مدل دید چند زبانه منبع باز (فقط برای تحقیقات) به نام Aya Vision را در اوایل این ماه منتشر کرد.

یک گام بالاتر از Command-R

هنگامی که Command-R در اوایل سال 2024 عرضه شد، نوآوری‌های کلیدی مانند عملکرد بهینه RAG، بازیابی دانش بهتر و استقرارهای هوش مصنوعی کم‌هزینه‌تر را معرفی کرد.

این مدل با شرکت‌هایی مانند Oracle، Notion، Scale AI، Accenture و McKinsey در راهکارهای تجاری ادغام شد، اما گزارش نوامبر 2024 از Menlo Ventures که به بررسی پذیرش سازمانی می‌پرداخت، سهم بازار Cohere را در بین شرکت‌ها 3٪ نشان داد که بسیار کمتر از OpenAI (34٪)، Anthropic (24٪) و حتی استارتاپ‌های کوچکی مانند Mistral (5٪) بود.

اکنون، در تلاش برای تبدیل شدن به یک جاذبه سازمانی بزرگتر، Command A این قابلیت ها را حتی بیشتر به جلو می برد. به گفته Cohere:

در وظایف تجاری، STEM و کدنویسی با GPT-4o و DeepSeek-V3 OpenAI مطابقت دارد یا از آنها بهتر عمل می کند.
فقط روی دو GPU (A100 یا H100) کار می کند، یک بهبود عمده در کارایی در مقایسه با مدل هایی که به 32 GPU نیاز دارند.
به تولید سریعتر توکن دست می یابد و 156 توکن در ثانیه تولید می کند - 1.75 برابر سریعتر از GPT-4o و 2.4 برابر سریعتر از DeepSeek-V3.
تأخیر را کاهش می دهد، با زمان 6500 میلی ثانیه تا اولین توکن، در مقایسه با 7460 میلی ثانیه برای GPT-4o و 14740 میلی ثانیه برای DeepSeek-V3.
قابلیت های هوش مصنوعی چند زبانه را تقویت می کند، با بهبود تطبیق لهجه عربی و پشتیبانی گسترده از 23 زبان جهانی.

Cohere در مستندات توسعه دهنده خود به صورت آنلاین اشاره می کند که: "Command A پرحرف است. به طور پیش فرض، این مدل تعاملی و بهینه شده برای مکالمه است، به این معنی که پرحرف است و از Markdown برای برجسته کردن کد استفاده می کند. برای لغو این رفتار، توسعه دهندگان باید از یک مقدمه استفاده کنند که از مدل می خواهد که به سادگی پاسخ را ارائه دهد و از نشانگرهای Markdown یا بلوک کد استفاده نکند."

ساخته شده برای شرکت

Cohere استراتژی اولویت‌بندی شرکت خود را با Command A ادامه داده است و اطمینان حاصل می‌کند که به طور یکپارچه در محیط‌های تجاری ادغام می‌شود. ویژگی های کلیدی عبارتند از:

تولید پیشرفته تقویت شده با بازیابی (RAG): پاسخ‌های قابل تأیید و با دقت بالا را برای برنامه‌های کاربردی سازمانی فعال می‌کند.
استفاده از ابزار Agentic: از گردش کار پیچیده با ادغام با ابزارهای سازمانی پشتیبانی می کند.
ادغام پلتفرم North AI: با پلتفرم North AI Cohere کار می کند و به کسب و کارها اجازه می دهد تا وظایف را با استفاده از عوامل هوش مصنوعی ایمن و درجه سازمانی خودکار کنند.
مقیاس پذیری و مقرون به صرفه بودن: استقرارهای خصوصی تا 50٪ ارزان تر از دسترسی مبتنی بر API هستند.

چند زبانه و بسیار پرقدرت در عربی

یکی از ویژگی های برجسته Command A توانایی آن در تولید پاسخ های دقیق در 23 زبان رایج در سراسر جهان، از جمله بهبود رسیدگی به لهجه های عربی است. زبان های پشتیبانی شده (طبق مستندات توسعه دهنده در وب سایت Cohere) عبارتند از:

انگلیسی
فرانسوی
اسپانیایی
ایتالیایی
آلمانی
پرتغالی
ژاپنی
کره ای
چینی
عربی
روسی
لهستانی
ترکی
ویتنامی
هلندی
چکی
اندونزیایی
اوکراینی
رومانیایی
یونانی
هندی
عبری
فارسی

در ارزیابی های معیار:

Command A در پاسخگویی به زبان عربی به درخواست های انگلیسی، دقت 98.2٪ را به دست آورد - بالاتر از DeepSeek-V3 (94.9٪) و GPT-4o (92.2٪).
به طور قابل توجهی از رقبا در سازگاری لهجه بهتر عمل کرد و نمره ADI2 24.7 را در مقایسه با 15.9 (GPT-4o) و 15.7 (DeepSeek-V3) به دست آورد.

ساخته شده برای سرعت و کارایی

سرعت یک عامل حیاتی برای استقرار هوش مصنوعی سازمانی است و Command A برای ارائه نتایج سریعتر از بسیاری از رقبای خود مهندسی شده است.

سرعت پخش توکن برای درخواست های متن 100K: 73 توکن/ثانیه (در مقایسه با GPT-4o با 38/ثانیه و DeepSeek-V3 با 32/ثانیه)
تولید سریعتر اولین توکن: زمان پاسخ را در مقایسه با سایر مدل های بزرگ به طور قابل توجهی کاهش می دهد.

قیمت گذاری و دسترسی

Command A اکنون در پلتفرم Cohere و با وزن های باز برای استفاده تحقیقاتی فقط در Hugging Face تحت مجوز بین المللی Creative Commons Attribution Non Commercial 4.0 (CC-by-NC 4.0) در دسترس است و پشتیبانی گسترده تر از ارائه دهنده خدمات ابری به زودی ارائه می شود.

توکن های ورودی: 2.50 دلار در هر میلیون
توکن های خروجی: 10.00 دلار در هر میلیون

استقرارهای خصوصی و در محل بنا به درخواست در دسترس هستند.

واکنش های صنعت

چندین محقق هوش مصنوعی و اعضای تیم Cohere اشتیاق خود را برای Command A به اشتراک گذاشته اند.

Dwaraknath Ganesan، پیش آموزش در Cohere، در X اظهار نظر کرد: "بسیار هیجان زده ام که آنچه را که در چند ماه گذشته روی آن کار کرده ایم، فاش کنم! Command A شگفت انگیز است. می توان آن را فقط بر روی 2 GPU H100 مستقر کرد! طول متن 256K، پشتیبانی چند زبانه گسترده، استفاده از ابزار عامل... به این یکی بسیار افتخار می کنم."

Pierre Richemond، محقق هوش مصنوعی در Cohere، اضافه کرد: "Command A مدل جدید 111B سطح GPT-4o/DeepSeek v3 ما با وزن های باز است که دارای طول متن 256K است که برای کارایی در موارد استفاده سازمانی بهینه شده است."

Command A با تکیه بر پایه Command-R، گام بعدی در هوش مصنوعی سازمانی مقیاس پذیر و مقرون به صرفه را نشان می دهد.

با سرعت‌های بالاتر، پنجره متن بزرگ‌تر، مدیریت چندزبانه بهبود یافته و هزینه‌های استقرار کمتر، جایگزین قدرتمندی برای مدل‌های هوش مصنوعی موجود به کسب‌وکارها ارائه می‌دهد.

برچسب‌ها هوش مصنوعی مدل زبانی بزرگ LLM Cohere Command A چند زبانه هوش مصنوعی سازمانی

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: venturebeat