Visual China Group / Getty Images
Visual China Group / Getty Images

چگونه DeepSeek قوانین مسابقه هوش مصنوعی را بازنویسی کرد

این استارتاپ چینی با کارایی و نوآوری خود، جهان را شگفت‌زده کرد.

اخیراً صحبت از هوش مصنوعی بدون برخورد به DeepSeek غیرممکن است.

شور و اشتیاق پیرامون استارتاپ هوش مصنوعی چینی، یادآور ظهور تماشایی ChatGPT در نوامبر 2022 است، زمانی که افرادی که هرگز به هوش مصنوعی فکر نکرده بودند، ناگهان در مورد محدودیت‌های توکن و مهندسی سریع صحبت می‌کردند.

تفاوت در این است که ChatGPT یک ابزار قدرتمند است، در حالی که DeepSeek نشان‌دهنده تغییری در چشم‌انداز جهانی هوش مصنوعی است.

استارتاپ

DeepSeek در ژوئیه 2023 توسط لیانگ ونفنگ (Liang Wenfeng) تأسیس شد و توسط صندوق پوشش ریسک کمی او، High-Flyer، پشتیبانی می‌شود. به همین دلیل، تا حدودی در هاله‌ای از رمز و راز قرار دارد. این یک شرکت سرمایه‌گذاری‌شده با رشد سریع نیست. همچنین یک غول دولتی نیست. نه شاخه‌ای از غول‌های فناوری واقعی چین، علی‌بابا یا تنسنت.

در ماه‌های قبل از رونمایی از مدل R1 DeepSeek در 20 ژانویه 2025، روایت‌های غربی به راحتی چین را به عنوان عقب‌تر از ایالات متحده در هوش مصنوعی به تصویر می‌کشیدند، که توسط تحریم‌های نیمه‌رسانای دوران بایدن مانع شده بود. رساله پر استناد لئوپولد آشِنبرنر (Leopold Aschenbrenner) از این دیدگاه حمایت می‌کرد و آزمایشگاه‌های چینی را به عنوان پیشرفت عمدتاً از طریق جاسوسی و نه نوآوری به تصویر می‌کشید.

انتشار DeepSeek R1 این روایت را کاملاً سوراخ کرد.

نوآوری‌های DeepSeek باورنکردنی بود. تماشای ردیابی استدلال مدل در زمان واقعی واقعاً قانع‌کننده بود، که گواهی بر انتخاب‌های معماری متفکرانه بود. مشاهده مدل که آشکارا در حال «فکر کردن» از طریق چالش‌ها بود، لذت‌بخش، حتی مسحورکننده بود، تجربه‌ای که به طور متمایزی جدید به نظر می‌رسید. این احساس مانند یک لحظه دیگر ChatGPT بود.

شاید تکان‌دهنده‌تر از آن، DeepSeek-R1-Zero بود، مدلی که در همان روز R1 منتشر شد، اما به طور کامل از طریق یادگیری تقویتی (Reinforcement Learning یا RL) آموزش داده شده بود. این مدل فقط مرزها را جابجا نکرد - ظاهراً آنها را از هم گسیخت. این مدل نشان داد که روش‌های RL چقدر می‌توانند مؤثر باشند، و ادراکات را به طور قابل توجهی تغییر داد و بهینه‌سازی سیاست مبتنی بر پاداش تعمیم‌یافته (Generalized Reward-based Policy Optimization یا GRPO) را که یک الگوریتم مبهم و آکادمیک بود، وارد کانون توجه قرار داد.

هر دو مدل کاملاً منبع باز بودند، به این معنی که هر شرکتی که به حریم خصوصی اهمیت می‌داد یا نمی‌خواست داده‌ها را ارسال کند، می‌توانست آنها را روی سرورهای خود میزبانی کند. بسیاری از آنها در حال حاضر این کار را انجام می‌دهند و عملکردی در سطح بالا دریافت می‌کنند.

اگر کسی هنوز پس از دیدن آن مدل‌ها شک داشت که DeepSeek چیز خاصی است، «هفته منبع باز» این استارتاپ احتمالاً آنها را متقاعد کرد. بین 24 فوریه و 28 فوریه، این شرکت پنج مخزن کد منتشر کرد که دیگران می‌توانند در پروژه‌های خود برای بهینه‌سازی عملکرد GPU، مدیریت مجموعه‌داده‌ها و موارد دیگر بگنجانند.

و اگر این کافی نبود، DeepSeek در ماه مارس اعلام کرد که مدل‌های آن می‌تواند پول زیادی به دست آورد - از لحاظ نظری، به هر حال.

به گفته این استارتاپ، اگر قیمت R1 را برای تمام خدمات خود دریافت کند (به جای اینکه برخی را با تخفیف یا رایگان ارائه دهد)، روزانه 562,027 دلار درآمد کسب می‌کند در حالی که 87,072 دلار برای اجاره GPU هزینه می‌کند. این یک حاشیه سود بزرگ است، به خصوص با توجه به اینکه DeepSeek همچنان کمترین قیمت‌ها را در بازار دریافت می‌کند، و بیشتر این استارتاپ را از همتایان آمریکایی خود که منابع زیادی مصرف می‌کنند و پول نقد می‌سوزانند، در مسابقه جهانی هوش مصنوعی متمایز می‌کند.

تاثیر

در روزی که DeepSeek-R1 راه اندازی شد، بازار سهام سقوط کرد زیرا معامله گران از فرسایش فرضی مزیت فناوری غرب وحشت زده شدند. در 27 ژانویه، قیمت سهام Nvidia 17 درصد کاهش یافت و تقریباً 600 میلیارد دلار از ارزش بازار آن از بین رفت. مارک اندریسن (Marc Andreessen) R1 را «لحظه اسپوتنیک هوش مصنوعی» نامید. رئیس جمهور دونالد ترامپ (Donald Trump) گفت که DeepSeek باید «زنگ بیداری» برای صنایع ایالات متحده باشد.

تأثیر DeepSeek بر بازار سهام تنها موقتی بود - در مسابقه تسلیحاتی هوش مصنوعی، همه به سیلیکون نیاز دارند، و سهام Nvidia بیشتر خسارات خود را در هفته‌های پس از انتشار R1 جبران کرد - اما ورود این استارتاپ تأثیر دائمی بر چشم انداز هوش مصنوعی گذاشته است.

سام آلتمن (Sam Altman) در طول یک گفتگو در هند در سال 2023، در مورد بیهودگی یک تیم کوچک با بودجه کم که سعی در رقابت با OpenAI در ساخت یک مدل بنیادی دارد، صحبت کرد - او تأکید کرد که شرکتش از نظر تحقیقات و منابع بسیار جلوتر است.

DeepSeek این روایت را نادرست ثابت کرده و نشان داده است که مقادیر زیادی سرمایه و تراشه‌های پیشرفته پیش‌نیاز هوش مصنوعی در سطح جهانی نیستند. این شرکت «مسابقه هوش مصنوعی» را نه فقط تراشه‌ها در مقابل تحریم‌ها، بلکه کارایی در مقابل نیروی بی‌رحمانه و زیرکی در مقابل مقیاس خام تعریف کرده است.

هر کشوری افراد باهوشی دارد و DeepSeek ثابت می‌کند که اگر افراد شما به اندازه کافی باهوش باشند، می‌توانید کارهای خارق‌العاده‌ای انجام دهید، حتی اگر منابع محدودی داشته باشید.

کوهی از منابع که همچنان به شرکت‌های آمریکایی سرازیر می‌شود، به این معنی است که چین ممکن است همچنان در مسابقه هوش مصنوعی عقب بماند، مهم نیست که محققانش چقدر زیرک باشند. تحریم تراشه همچنان در حال اجرا است، و پروژه Stargate، یک همکاری بین OpenAI، Oracle و SoftBank، 500 میلیارد دلار در ساخت زیرساخت هوش مصنوعی در ایالات متحده سرمایه‌گذاری خواهد کرد و به این کشور کمک می‌کند تا موقعیت رهبری خود را در این زمینه حفظ کند.

در عین حال، لیانگ اخیراً با رئیس جمهور چین، شی جین پینگ (Xi Jinping)، ملاقات کرد، که نشان می‌دهد DeepSeek از حمایت کشور قدرتمند خود برخوردار است.

در نهایت، نکته اصلی که باید از DeepSeek برداشت شود این است که احتمالاً آینده هوش مصنوعی توسط یک کشور یا گروه ساخته نخواهد شد. این فرایند بسیار دموکراتیک‌تر از آن چیزی است که انتظار می‌رفت، و کشوری که بسیاری معتقد بودند تنها با تقلب می‌تواند در مسابقه هوش مصنوعی جلو بیفتد، معلوم شد که یک آزمایشگاه تحقیقاتی دارد که قادر است غول‌ها را پشت سر بگذارد - حداقل به طور موقت.

ما دوست داریم از شما بشنویم! اگر نظری در مورد این مقاله دارید یا اگر نکته‌ای برای یک داستان Freethink آینده دارید، لطفاً به ما ایمیل بزنید.