اعتبار: VentureBeat ساخته شده با Midjourney
اعتبار: VentureBeat ساخته شده با Midjourney

تغییر بزرگ در سهم بازار هوش مصنوعی: سقوط ۸۰ درصدی DALL-E و تسلط Black Forest Labs بر داده‌های ۲۰۲۵

نموداری که میزان استفاده از مدل‌های هوش مصنوعی را در Poe در طول سال‌های ۲۰۲۴-۲۰۲۵ ردیابی می‌کند، نشان می‌دهد که مدل‌های GPT-4o از OpenAI و Claude از Anthropic بر بازار تولید متن تسلط دارند، در حالی که تازه‌واردانی مانند DeepSeek شروع به تصاحب سهم قابل توجهی از بازار کرده‌اند.
مدل Veo-2 گوگل (زرد) در فوریه ۲۰۲۵ ظاهر شد تا ۳۹.۸ درصد از پیام‌های تولید ویدیو را به خود اختصاص دهد و به سرعت جایگزین رهبر اولیه Runway (آبی) شد، که علی‌رغم مزیت پیشگامی خود به ۳۱.۶ درصد سقوط کرد.
بازار تولید تصویر از اوایل سال ۲۰۲۴ تا ۲۰۲۵ دچار یک تغییر کامل شد، به طوری که مدل‌های Flux از Black Forest Labs و Imagen3 گوگل جایگزین رهبر اولیه Dall-E-3 شدند، طبق داده‌های استفاده Poe.

داده‌های جدید نشان می‌دهند که در سال ۲۰۲۵، تغییرات چشمگیری در سهم بازار هوش مصنوعی رخ داده است و تغییرات سریعی در نحوه استفاده کسب‌وکارها و مصرف‌کنندگان از ابزارهای هوش مصنوعی ایجاد شده است. Poe، پلتفرمی که میزبان بیش از ۱۰۰ مدل هوش مصنوعی است، گزارشی جامع منتشر کرده است که نگاهی بی‌سابقه به الگوهای استفاده واقعی در فناوری‌های تولید متن، تصویر و ویدیو ارائه می‌دهد.

تحلیل Poe، بر اساس تعاملات میلیون‌ها کاربر در طول سال گذشته، بینش‌های حیاتی را برای تصمیم‌گیرندگان فنی در یک عرصه رقابتی ارائه می‌دهد که در آن داده‌های استفاده معمولاً به دقت محافظت می‌شوند. این شرکت می‌نویسد: «با پیشرفت مداوم مدل‌های هوش مصنوعی، ما معتقدیم که آنها به عنصری اساسی در نحوه کسب دانش، انجام وظایف پیچیده و مدیریت کار روزمره افراد تبدیل خواهند شد.»

یافته‌ها، تکه‌تکه شدن قابل توجه بازار را در تمام روش‌های هوش مصنوعی برجسته می‌کنند. در حالی که بازیگران شناخته‌شده‌ای مانند OpenAI و Anthropic موقعیت‌های مسلط خود را در تولید متن حفظ می‌کنند، تازه‌واردانی مانند DeepSeek (در متن) و Black Forest Labs (در تولید تصویر) به سرعت سهم قابل توجهی از بازار را به دست آورده‌اند، که نشان‌دهنده یک اکوسیستم پویا علی‌رغم سرمایه‌گذاری‌های عظیم در رهبران صنعت است.

در اینجا پنج نکته شگفت‌انگیز از تجزیه و تحلیل Poe از اکوسیستم هوش مصنوعی اوایل سال ۲۰۲۵ آورده شده است.

۱. عملکرد ناهموار گوگل در ابزارهای مختلف هوش مصنوعی

عملکرد متفاوت گوگل در ابزارهای مختلف هوش مصنوعی، چالش‌های دستیابی به رهبری بین ابزاری را نشان می‌دهد. خانواده مدل‌های متنی Gemini آن «تا اکتبر ۲۰۲۴ شاهد رشد سهم پیام‌ها بوده‌اند»، اما علی‌رغم سرمایه‌گذاری و قابلیت‌های فنی قابل توجه، «از آن زمان رو به کاهش بوده است».

این امر در تضاد شدید با عملکرد گوگل در سایر دسته‌ها است. در تولید تصویر، خانواده Imagen3 گوگل سهم بازار چشمگیر ۳۰ درصدی را به دست آورده است، در حالی که در تولید ویدیو، مدل Veo-2 آن به سرعت ۴۰ درصد از پیام‌ها را به خود اختصاص داده است.

این عملکرد مختلط نشان می‌دهد که برتری فنی به تنهایی تضمین‌کننده رهبری بازار نیست. برای تصمیم‌گیرندگان سازمانی، این امر اهمیت ارزیابی قابلیت‌های هوش مصنوعی را به صورت ابزاری به ابزاری برجسته می‌کند، نه اینکه فرض کنیم رهبری در یک زمینه به معنای برتری در تمام قابلیت‌های هوش مصنوعی است.

۲. تولید ویدیو رقابت پرشتابی را تجربه می‌کند

تولید ویدیو، جدیدترین مرز در هوش مصنوعی مولد (Generative AI)، تاکنون شاهد رقابت شدید و تغییر سریع موقعیت‌های رهبری بوده است. بر اساس این گزارش، «دسته تولید ویدیو، در حالی که تنها از اواخر سال ۲۰۲۴ وجود داشته است، به سرعت به بیش از هشت ارائه‌دهنده گسترش یافته است که اکنون گزینه‌های متنوعی را به مشترکین ارائه می‌دهند.»

Runway، یک پیشگام اولیه، «با ۳۰ تا ۵۰ درصد از پیام‌های تولید ویدیو، موقعیت قوی خود را حفظ کرده است» علی‌رغم اینکه فقط یک مدل API دارد. با این حال، ورود گوگل فوراً وضعیت موجود را مختل کرده است: «Veo-2 گوگل، از زمان عرضه اخیر خود در Poe، به سرعت نزدیک به ۴۰ درصد از کل پیام‌های تولید ویدیو را تنها در چند هفته به خود اختصاص داده است.»

مدل‌های توسعه‌یافته چینی در مجموع تقریباً ۱۵ درصد از پیام‌های تولید ویدیو را تشکیل می‌دهند. مدل‌هایی مانند «Kling-Pro-v1.5، Hailuo-AI، HunyuanVideo و Wan-2.1 به فشار دادن مرزهای قابلیت‌ها، زمان استنتاج و هزینه ادامه می‌دهند» و نشان می‌دهند که رقابت بین‌المللی علیرغم تنش‌های ژئوپلیتیکی، همچنان یک عامل مهم در پیشبرد نوآوری است.

۳. تولید تصویر دستخوش تحول اساسی می‌شود

زمینه تولید تصویر شاید چشمگیرترین تغییر بازار را در هوش مصنوعی مولد نشان می‌دهد، به طوری که بازیگران شناخته‌شده به سرعت جای خود را به تازه‌واردان می‌دهند. این گزارش بیان می‌کند: «مدل‌های تولید تصویر پیشگام مانند Dall-E-3 و نسخه‌های مختلف Stable Diffusion در این فضا پیشگام بودند، اما با افزایش تعداد مدل‌های رسمی تولید تصویر از ۳ به ۲۵، سهم نسبی استفاده آنها تقریباً ۸۰ درصد کاهش یافته است.»

Black Forest Labs به عنوان رهبر غافلگیرکننده ظاهر شد: «خانواده مدل‌های تولید تصویر Flux از Black Forest Labs در اواسط سال ۲۰۲۴ به صحنه آمدند و از آن زمان موقعیت غالب خود را به عنوان پیشتاز مشخص حفظ کرده‌اند و نزدیک به ۴۰ درصد از پیام‌ها را به خود اختصاص داده‌اند.» این نشان‌دهنده یک دستاورد قابل توجه برای یک تازه‌وارد نسبی در برابر رقبای شناخته‌شده با منابع عظیم است.

۴. OpenAI و Anthropic سلطنت خود را در تولید متن حفظ می‌کنند، اما DeepSeek نفوذ می‌کند

در تولید متن، بازار کمترین تغییر را نسبت به روش‌های دیگر هوش مصنوعی مولد نشان می‌دهد. با این حال، یک رقیب جدی در حال ظهور است.

به گفته Poe، «مدل‌های GPT-4o و Claude از OpenAI و Anthropic به طور مداوم بر بازار تسلط داشته‌اند، با هم در مجموع بین ۶۰ تا ۸۰ درصد از تمام پیام‌های متنی را تشکیل می‌دهند.» این نشان می‌دهد که در حالی که پویایی کلی در چشم‌انداز هوش مصنوعی مولد سیال است، مدل‌های پایه‌ای تاسیس‌شده هنوز یک پایگاه کاربر قوی و وفادار دارند.

با این حال، این وفاداری مطلق نیست: «DeepSeek نیز به سرعت در حال ظهور است و از زمان عرضه خود به سهم حدود ۱۰ درصد از پیام‌های متن دست یافته است.» این افزایش چشمگیر نشان می‌دهد که این شرکت در حال ارائه چیزی متفاوت است که با مخاطبان خاصی طنین‌انداز می‌شود، و باعث می‌شود کاربران به سمت بازیگران مستقر جذب شوند.

۵. مدل‌های بسیار کم مصرف بسیار محبوب هستند

یکی دیگر از شگفتی‌های گزارش Poe این است که مدل‌های کوچکتر به دلیل کارایی و مقرون به صرفه بودن، مخاطبان اختصاصی خود را دارند. بر اساس این گزارش، «گزینه‌های با مصرف کم در بین طیف گسترده‌ای از کاربران، محبوبیت بیشتری پیدا کرده‌اند و نشان می‌دهد که مدل‌هایی مانند Claude Instant و Gemini Pro1.5 که زمان استنتاج سریع‌تری دارند و در نهایت برای Poe مقرون به صرفه‌تر هستند، می‌توانند بخش قابل توجهی از مخاطبان و موارد استفاده متمایز خود را به خود جلب کنند.»

این یافته بینش ارزشمندی را برای توسعه محصول ارائه می‌دهد: همه کاربران به بالاترین پیچیدگی فنی نیاز ندارند. برای بسیاری از موارد استفاده، تعادل بین قابلیت‌ها، سرعت و هزینه کافی است، و این منجر به فرصت‌هایی برای مدل‌های متخصص و بهینه می‌شود.