ممکن است دیپ‌سیک آنقدرها که ادعا می‌شود تحول‌آفرین نباشد، گزارش‌ها حاکی از آن است که این شرکت دارای 50000 پردازنده گرافیکی انویدیا بوده و 1.6 میلیارد دلار صرف ساخت و ساز کرده است

استارتاپ چینی دیپ‌سیک اخیراً با استفاده شگفت‌آور کم از منابع محاسباتی برای مدل پیشرفته هوش مصنوعی خود به نام R1، که اعتقاد بر این است که با o1 اوپن‌ای‌آی رقابت می‌کند، در دنیای فناوری در مرکز توجه قرار گرفت، علی‌رغم ادعاهای شرکت مبنی بر اینکه آموزش دیپ‌سیک تنها 6 میلیون دلار و 2048 پردازنده گرافیکی هزینه داشته است. با این حال، شرکت تحلیلگر صنعت SemiAnalysis گزارش می‌دهد که شرکت پشت دیپ‌سیک 1.6 میلیارد دلار هزینه سخت‌افزاری متحمل شده و دارای ناوگانی متشکل از 50000 پردازنده گرافیکی هاپر انویدیا است، یافته‌ای که این ایده را تضعیف می‌کند که دیپ‌سیک آموزش و استنتاج هوش مصنوعی را با سرمایه‌گذاری‌های بسیار کمتری نسبت به رهبران صنعت هوش مصنوعی بازآفرینی کرده است. 

این گزارش مدعی است که دیپ‌سیک یک زیرساخت محاسباتی گسترده با حدود 50000 پردازنده گرافیکی هاپر اداره می‌کند. به گفته SemiAnalysis، این شامل 10000 H800 و 10000 H100، با خریدهای اضافی واحدهای H20 است. این منابع در چندین مکان توزیع شده‌اند و اهدافی مانند آموزش هوش مصنوعی، تحقیق و مدل‌سازی مالی را انجام می‌دهند. به گفته SemiAnalysis، کل سرمایه‌گذاری سرمایه‌ای این شرکت در سرورها حدود 1.6 میلیارد دلار است و تخمین زده می‌شود 944 میلیون دلار برای هزینه‌های عملیاتی صرف شده باشد.

دیپ‌سیک زمانی که الزامات سخت‌افزاری بسیار کوچک مدل هوش مصنوعی دیپ‌سیک-V3 Mixture-of-Experts (MoE) خود را فاش کرد که در مقایسه با مدل‌های مستقر در ایالات متحده بسیار کمتر است، توجه دنیای هوش مصنوعی را به خود جلب کرد. سپس دیپ‌سیک با مدل هوش مصنوعی R1 رقابتی با Open AI، دنیای فناوری پیشرفته را تکان داد. با این حال، شرکت معتبر اطلاعات بازار SemiAnalysis یافته‌های خود را فاش کرد که نشان می‌دهد این شرکت حدود 1.6 میلیارد دلار سرمایه‌گذاری سخت‌افزاری داشته است.

دیپ‌سیک از های-فلایر، یک صندوق پوشش ریسک چینی که هوش مصنوعی را زودتر پذیرفت و به شدت در پردازنده‌های گرافیکی سرمایه‌گذاری کرد، سرچشمه می‌گیرد. در سال 2023، های-فلایر دیپ‌سیک را به عنوان یک سرمایه‌گذاری جداگانه که صرفاً بر هوش مصنوعی متمرکز است، راه‌اندازی کرد. برخلاف بسیاری از رقبا، دیپ‌سیک همچنان خود-تامین مالی است و به آن انعطاف‌پذیری و سرعت در تصمیم‌گیری می‌دهد. به گفته SemiAnalysis، علی‌رغم ادعاها مبنی بر اینکه یک انشعاب کوچک است، این شرکت بیش از 500 میلیون دلار در فناوری خود سرمایه‌گذاری کرده است.

یکی از عوامل تمایز اصلی برای دیپ‌سیک، توانایی آن در اجرای مراکز داده خود است، برخلاف اکثر استارتاپ‌های هوش مصنوعی دیگر که به ارائه‌دهندگان ابر خارجی متکی هستند. این استقلال امکان کنترل کامل بر آزمایش‌ها و بهینه‌سازی‌های مدل هوش مصنوعی را فراهم می‌کند. علاوه بر این، تکرار سریع را بدون گلوگاه‌های خارجی امکان‌پذیر می‌کند، که دیپ‌سیک را در مقایسه با بازیکنان سنتی در صنعت بسیار کارآمد می‌کند.

سپس چیزی وجود دارد که از یک شرکت چینی انتظار نمی‌رود: جذب استعداد از سرزمین اصلی چین، بدون شکار از تایوان یا ایالات متحده. به گفته SemiAnalysis، دیپ‌سیک منحصراً از داخل چین استخدام می‌کند و به جای مدارک رسمی، بر مهارت‌ها و توانایی‌های حل مسئله تمرکز دارد. تلاش‌های استخدامی مؤسساتی مانند دانشگاه پکن و دانشگاه ژجیانگ را هدف قرار می‌دهد و حقوق‌های بسیار رقابتی ارائه می‌دهد. بر اساس این تحقیق، برخی از محققان هوش مصنوعی در دیپ‌سیک بیش از 1.3 میلیون دلار درآمد دارند که از حقوق در سایر شرکت‌های پیشرو هوش مصنوعی چینی مانند مون‌شات فراتر می‌رود.

به گزارش SemiAnalysis، به دلیل هجوم استعدادها، دیپ‌سیک نوآوری‌هایی مانند Multi-Head Latent Attention (MLA) را پیشگام کرده است که ماه‌ها توسعه و استفاده قابل توجه از پردازنده‌های گرافیکی را به همراه داشت. دیپ‌سیک بر کارایی و بهبود الگوریتمی به جای مقیاس‌بندی نیروی بی‌رحمانه تأکید می‌کند و انتظارات پیرامون توسعه مدل هوش مصنوعی را تغییر می‌دهد. به همین دلیل، این رویکرد باعث شده است برخی باور کنند که پیشرفت‌های سریع ممکن است تقاضا برای پردازنده‌های گرافیکی رده بالا را کاهش دهد و بر شرکت‌هایی مانند انویدیا تأثیر بگذارد.

ادعای اخیر مبنی بر اینکه دیپ‌سیک آخرین مدل خود را تنها با 6 میلیون دلار آموزش داده است، به بیشتر هیاهوها دامن زده است. با این حال، این رقم تنها به بخشی از کل هزینه آموزش، به طور خاص، زمان پردازنده گرافیکی مورد نیاز برای پیش آموزش اشاره دارد. این هزینه شامل تحقیق، اصلاح مدل، پردازش داده‌ها یا هزینه‌های کلی زیرساخت نمی‌شود. در واقعیت، دیپ‌سیک از زمان تأسیس خود، بیش از 500 میلیون دلار برای توسعه هوش مصنوعی هزینه کرده است. بر خلاف شرکت‌های بزرگ‌تر که گرفتار بروکراسی هستند، ساختار ناب دیپ‌سیک به آن امکان می‌دهد تا به طور تهاجمی در نوآوری هوش مصنوعی پیش برود، به اعتقاد SemiAnalysis.

ظهور دیپ‌سیک نشان می‌دهد که چگونه یک شرکت هوش مصنوعی مستقل و با بودجه مناسب می‌تواند رهبران صنعت را به چالش بکشد. با این حال، ممکن است گفتمان عمومی ناشی از هیاهو بوده باشد. واقعیت پیچیده‌تر است: SemiAnalysis معتقد است که موفقیت دیپ‌سیک بر اساس سرمایه‌گذاری‌های استراتژیک میلیاردها دلار، پیشرفت‌های فنی و نیروی کار رقابتی است. معنای آن این است که هیچ شگفتی وجود ندارد. همانطور که ایلان ماسک حدود یک سال پیش اشاره کرد، اگر می‌خواهید در هوش مصنوعی رقابتی باشید، باید میلیاردها دلار در سال خرج کنید، که طبق گزارش‌ها در محدوده هزینه‌های انجام شده است.

درباره نویسنده

آنتون شیلوف نویسنده همکار در Tom’s Hardware است. در طول دو دهه گذشته، او همه چیز را از پردازنده‌های مرکزی و پردازنده‌های گرافیکی گرفته تا ابررایانه‌ها و از فناوری‌های فرآیند مدرن و آخرین ابزارهای ساخت گرفته تا روندهای صنعت فناوری پیشرفته پوشش داده است.