استارتاپ چینی دیپسیک اخیراً با استفاده شگفتآور کم از منابع محاسباتی برای مدل پیشرفته هوش مصنوعی خود به نام R1، که اعتقاد بر این است که با o1 اوپنایآی رقابت میکند، در دنیای فناوری در مرکز توجه قرار گرفت، علیرغم ادعاهای شرکت مبنی بر اینکه آموزش دیپسیک تنها 6 میلیون دلار و 2048 پردازنده گرافیکی هزینه داشته است. با این حال، شرکت تحلیلگر صنعت SemiAnalysis گزارش میدهد که شرکت پشت دیپسیک 1.6 میلیارد دلار هزینه سختافزاری متحمل شده و دارای ناوگانی متشکل از 50000 پردازنده گرافیکی هاپر انویدیا است، یافتهای که این ایده را تضعیف میکند که دیپسیک آموزش و استنتاج هوش مصنوعی را با سرمایهگذاریهای بسیار کمتری نسبت به رهبران صنعت هوش مصنوعی بازآفرینی کرده است.
این گزارش مدعی است که دیپسیک یک زیرساخت محاسباتی گسترده با حدود 50000 پردازنده گرافیکی هاپر اداره میکند. به گفته SemiAnalysis، این شامل 10000 H800 و 10000 H100، با خریدهای اضافی واحدهای H20 است. این منابع در چندین مکان توزیع شدهاند و اهدافی مانند آموزش هوش مصنوعی، تحقیق و مدلسازی مالی را انجام میدهند. به گفته SemiAnalysis، کل سرمایهگذاری سرمایهای این شرکت در سرورها حدود 1.6 میلیارد دلار است و تخمین زده میشود 944 میلیون دلار برای هزینههای عملیاتی صرف شده باشد.
دیپسیک زمانی که الزامات سختافزاری بسیار کوچک مدل هوش مصنوعی دیپسیک-V3 Mixture-of-Experts (MoE) خود را فاش کرد که در مقایسه با مدلهای مستقر در ایالات متحده بسیار کمتر است، توجه دنیای هوش مصنوعی را به خود جلب کرد. سپس دیپسیک با مدل هوش مصنوعی R1 رقابتی با Open AI، دنیای فناوری پیشرفته را تکان داد. با این حال، شرکت معتبر اطلاعات بازار SemiAnalysis یافتههای خود را فاش کرد که نشان میدهد این شرکت حدود 1.6 میلیارد دلار سرمایهگذاری سختافزاری داشته است.
دیپسیک از های-فلایر، یک صندوق پوشش ریسک چینی که هوش مصنوعی را زودتر پذیرفت و به شدت در پردازندههای گرافیکی سرمایهگذاری کرد، سرچشمه میگیرد. در سال 2023، های-فلایر دیپسیک را به عنوان یک سرمایهگذاری جداگانه که صرفاً بر هوش مصنوعی متمرکز است، راهاندازی کرد. برخلاف بسیاری از رقبا، دیپسیک همچنان خود-تامین مالی است و به آن انعطافپذیری و سرعت در تصمیمگیری میدهد. به گفته SemiAnalysis، علیرغم ادعاها مبنی بر اینکه یک انشعاب کوچک است، این شرکت بیش از 500 میلیون دلار در فناوری خود سرمایهگذاری کرده است.
یکی از عوامل تمایز اصلی برای دیپسیک، توانایی آن در اجرای مراکز داده خود است، برخلاف اکثر استارتاپهای هوش مصنوعی دیگر که به ارائهدهندگان ابر خارجی متکی هستند. این استقلال امکان کنترل کامل بر آزمایشها و بهینهسازیهای مدل هوش مصنوعی را فراهم میکند. علاوه بر این، تکرار سریع را بدون گلوگاههای خارجی امکانپذیر میکند، که دیپسیک را در مقایسه با بازیکنان سنتی در صنعت بسیار کارآمد میکند.
سپس چیزی وجود دارد که از یک شرکت چینی انتظار نمیرود: جذب استعداد از سرزمین اصلی چین، بدون شکار از تایوان یا ایالات متحده. به گفته SemiAnalysis، دیپسیک منحصراً از داخل چین استخدام میکند و به جای مدارک رسمی، بر مهارتها و تواناییهای حل مسئله تمرکز دارد. تلاشهای استخدامی مؤسساتی مانند دانشگاه پکن و دانشگاه ژجیانگ را هدف قرار میدهد و حقوقهای بسیار رقابتی ارائه میدهد. بر اساس این تحقیق، برخی از محققان هوش مصنوعی در دیپسیک بیش از 1.3 میلیون دلار درآمد دارند که از حقوق در سایر شرکتهای پیشرو هوش مصنوعی چینی مانند مونشات فراتر میرود.
به گزارش SemiAnalysis، به دلیل هجوم استعدادها، دیپسیک نوآوریهایی مانند Multi-Head Latent Attention (MLA) را پیشگام کرده است که ماهها توسعه و استفاده قابل توجه از پردازندههای گرافیکی را به همراه داشت. دیپسیک بر کارایی و بهبود الگوریتمی به جای مقیاسبندی نیروی بیرحمانه تأکید میکند و انتظارات پیرامون توسعه مدل هوش مصنوعی را تغییر میدهد. به همین دلیل، این رویکرد باعث شده است برخی باور کنند که پیشرفتهای سریع ممکن است تقاضا برای پردازندههای گرافیکی رده بالا را کاهش دهد و بر شرکتهایی مانند انویدیا تأثیر بگذارد.
ادعای اخیر مبنی بر اینکه دیپسیک آخرین مدل خود را تنها با 6 میلیون دلار آموزش داده است، به بیشتر هیاهوها دامن زده است. با این حال، این رقم تنها به بخشی از کل هزینه آموزش، به طور خاص، زمان پردازنده گرافیکی مورد نیاز برای پیش آموزش اشاره دارد. این هزینه شامل تحقیق، اصلاح مدل، پردازش دادهها یا هزینههای کلی زیرساخت نمیشود. در واقعیت، دیپسیک از زمان تأسیس خود، بیش از 500 میلیون دلار برای توسعه هوش مصنوعی هزینه کرده است. بر خلاف شرکتهای بزرگتر که گرفتار بروکراسی هستند، ساختار ناب دیپسیک به آن امکان میدهد تا به طور تهاجمی در نوآوری هوش مصنوعی پیش برود، به اعتقاد SemiAnalysis.
ظهور دیپسیک نشان میدهد که چگونه یک شرکت هوش مصنوعی مستقل و با بودجه مناسب میتواند رهبران صنعت را به چالش بکشد. با این حال، ممکن است گفتمان عمومی ناشی از هیاهو بوده باشد. واقعیت پیچیدهتر است: SemiAnalysis معتقد است که موفقیت دیپسیک بر اساس سرمایهگذاریهای استراتژیک میلیاردها دلار، پیشرفتهای فنی و نیروی کار رقابتی است. معنای آن این است که هیچ شگفتی وجود ندارد. همانطور که ایلان ماسک حدود یک سال پیش اشاره کرد، اگر میخواهید در هوش مصنوعی رقابتی باشید، باید میلیاردها دلار در سال خرج کنید، که طبق گزارشها در محدوده هزینههای انجام شده است.
درباره نویسنده
آنتون شیلوف نویسنده همکار در Tom’s Hardware است. در طول دو دهه گذشته، او همه چیز را از پردازندههای مرکزی و پردازندههای گرافیکی گرفته تا ابررایانهها و از فناوریهای فرآیند مدرن و آخرین ابزارهای ساخت گرفته تا روندهای صنعت فناوری پیشرفته پوشش داده است.