دیپسیک چالشی برای پکن و سیلیکون ولی است
با انتشار آخرین مدل هوش مصنوعی (AI) خود، دیپسیک، یک شرکت مبهم چینی، چندین سال سیاست آمریکا با هدف عقب نگه داشتن نوآوری چین را از بین برده است - و در این فرآیند، حفرهای در ارزشگذاری شرکتها از انویدیا، قهرمان تراشه AI آمریکا، تا زیمنس انرژی، تولیدکننده تجهیزات الکتریکی مورد استفاده در مراکز داده، ایجاد کرده است (به مقاله قبلی مراجعه کنید). دیپسیک با نشان دادن توانایی خود در نوآوری در زمینه محدودیتهای صادراتی آمریکا، این تردید را ایجاد کرده است که آیا دسترسی به انبوهی از نیمهرساناهای پیشرفته و تجهیزات مرتبط به همان اندازه که قبلاً تصور میشد، برای آموزش مدلهای AI مهم است یا خیر.
مردی که در مرکز همه اینها قرار دارد، لیانگ ونفنگ، بنیانگذار 40 ساله دیپسیک است. مشخص نیست که او چقدر از آشفتگی بازار جهانی که ایجاد کرده است لذت برده است. یک همکلاسی دبیرستانی که اخیراً با رسانههای محلی صحبت کرده است، گفت که آقای لیانگ برای سال نو قمری که از 29 ژانویه آغاز شده است، در زادگاهش مخفی شده است. آقای لیانگ که در رسانههای اجتماعی چین به دلیل ظاهر لاغر و رنگ پریدهاش مورد تمسخر قرار گرفته است، برای اکثر مردم یک راز باقی مانده است. کسانی که با دیپسیک معاملات حرفهای داشتهاند، میگویند که او وسواس زیادی به هوش مصنوعی عمومی (AGI) شبیه انسان و تأثیری که میتواند بر جهان داشته باشد، دارد. بنیانگذار دیپسیک در پیگیری آن، ایدهها در مورد پیشرفتهای فناوری را هم در غرب و هم در چین برهم میزند.
اطلاعات عمومی در مورد آقای لیانگ اندک است. او که در سال 1985 در خانوادهای معلم در روستایی فقیرنشین در نزدیکی شهر جنوبی ژانجیانگ به دنیا آمد، دانشآموز با استعدادی بود. یک مربی سابق ادعا کرد که او در مدرسه راهنمایی بر ریاضیات سطح دانشگاه مسلط شده است. در سال 2002 او وارد رشته مهندسی اطلاعات الکترونیکی در دانشگاه ژجیانگ، یک مدرسه معتبر در شهر هانگژو در شرق چین شد. مدرک کارشناسی ارشد در همان دانشگاه، زیر نظر یک دانشمند مشهور بینایی ماشین، او را در معرض زمینه هوش مصنوعی قرار داد.
در آن زمان، هانگژو مرکز پر جنب و جوشی برای فناوری اینترنت و خانه گروههای در حال ظهور مانند علی بابا، یک شرکت تجارت الکترونیک بود. آقای لیانگ و چندین همکلاسی در شهر ماندند و شروع به آزمایش مدلهای سرمایهگذاری کمی کردند، که به جای مبانی شرکت، به تجزیه و تحلیل انبوه دادهها تکیه میکردند. در سال 2013، آقای لیانگ و سه همکلاسی یک گروه سرمایهگذاری به نام یاکبی را راهاندازی کردند تا مدلهای معاملاتی که ساخته بودند را به پول تبدیل کنند.
دو سال بعد، آقای لیانگ به طور مشترک High-Flyer، یک صندوق تامینی کمی را تاسیس کرد که در دوره مقرراتزدایی و نوسانات بازار در چین به سرعت در کنار دهها شرکت مشابه رشد کرد. در سال 2021 ادعا شد که تا 100 میلیارد یوان (14 میلیارد دلار) را مدیریت میکند، اگرچه به نظر میرسد در نیمه دوم همان سال به سرعت کوچک شده است. صندوقهای کمی به طور معمول با مقرراتگذاران چینی درگیر بودهاند، که آنها را متهم به سود بردن از بحرانهای بازار میدانند. افراد آگاه صنعت میگویند High-Flyer به عنوان یکی از تهاجمیترین صندوقهای کمی شناخته شده است که به طور مرتب خشم تنظیم کنندگان اوراق بهادار را برمیانگیخت.
ریشههای دیپسیک در تلاشی برای بهبود الگوریتمهای High-Flyer نهفته است. در سال 2019، این گروه 200 میلیون یوان سرمایهگذاری کرد تا یک واحد جداگانه برای توسعه پلتفرم یادگیری عمیق خود به نام "Fire-Flyer 1" راهاندازی کند. این صندوق در سال 2021، 1 میلیارد یوان دیگر را در این تلاش برای راهاندازی نسخه دوم مسلح به 10000 واحد پردازش گرافیکی A100 انویدیا هزینه کرد. این امر باعث شد High-Flyer یک استثنا باشد: در آن زمان تنها چهار شرکت دیگر در چین چنین زرادخانههای بزرگی از تراشههای قدرتمند داشتند که همه آنها غولهای فناوری مانند علی بابا بودند. دیپسیک در سال 2023 به یک شرکت مستقل تبدیل شد.
این شرکت اولین شوک خود را به بازار در ماه مه سال گذشته وارد کرد، زمانی که یک ربات چت فوقالعاده ارزان مبتنی بر مدل V2 خود را منتشر کرد. این امر جنگ قیمتی را در صنعت هوش مصنوعی چین آغاز کرد و بزرگترین شرکتهای فناوری این کشور - علی بابا، بایدو، بایت دنس و تنسنت - را مجبور کرد قیمتهای خود را کاهش دهند.
به گفته خود آقای لیانگ، این یک ترفند برای جذب کاربران بیشتر نبود. در ماه جولای، او گفت که هزینهها با بررسی ساختارهای جدید مدل توسط دیپسیک کاهش یافته است، چیزی که آن را از دیگران متمایز میکرد. اگرچه گروههای رقیب هوش مصنوعی چینی تحقیقاتی در مورد مدلها انجام دادهاند، اما ضعف آنها در قدرت محاسباتی، به دلیل محدودیتهای صادراتی آمریکا، آنها را به تمرکز بیشتر بر ایجاد برنامههای هوشمندانه که از این فناوری استفاده میکنند، سوق داده است. بسیاری از گروههای هوش مصنوعی چین از Llama، خانواده مدلهای زبان بزرگ توسعه یافته توسط متا، غول رسانههای اجتماعی آمریکا، به عنوان مبنایی برای برنامههای خود استفاده کردهاند.
تفکرات عمیق
برای آقای لیانگ، توسعه مدلها با استفاده از قدرت محاسباتی کمتر، یک گام اساسی در پیگیری هدف بلندمدت او است. او به رسانههای محلی گفته است: "هدف ما AGI است که مستلزم آن است که برای دستیابی به تواناییهای برتر در منابع محدود، ساختارهای مدل جدید را بررسی کنیم."
مدل جدید R1 دیپسیک که غرب را شوکه کرده است، نشان میدهد که این شرکت در حال پیشرفت است. این شرکت میگوید که آموزش آن کمتر از 6 میلیون دلار هزینه داشته است، کسری بسیار کوچک از مدلهای مشابه از شرکتهایی مانند OpenAI، سازنده ChatGPT. سم آلتمن، رئیس OpenAI، مدل R1 را "تحسینبرانگیز" خوانده است (اگرچه او همچنین قول داده است که "مدلهای بسیار بهتری" تولید کند و اضافه کرد که "داشتن یک رقیب جدید واقعاً نشاط آور است").
دیپسیک قطعاً شکاکانی دارد. آزمایشهای اولیه به نظر میرسد تأیید میکند که R1 به همان اندازه که سازنده آن میگوید قدرتمند است. اما برخی این سوال را مطرح کردهاند که آیا این شرکت تعداد تراشههای سطح بالایی را که برای توسعه مدل استفاده کرده است، کماهمیت جلوه داده است یا خیر، حتی اگر برخی دیگر استدلال کنند که ادعاهای آن معقول است. همچنین این گمانهزنی وجود دارد که دیپسیک مدلهای خود را با مطالعه نتایج مدلهای آمریکایی آموزش داده است، فرآیندی که به عنوان "تقطیر" شناخته میشود. OpenAI گفته است که شواهدی دارد که نشان میدهد دیپسیک مدلهای خود را تقطیر کرده است که نقض شرایط خدمات آن است.
با این حال، اگر دیپسیک واقعاً کارآمد باشد، همانطور که بسیاری معتقدند، پس این یک توهین هم به توانایی فناوری آمریکا و هم به مدل نوآوری تحت رهبری دولت چین است. رسانههای دولتی چین به سرعت از دیپسیک به عنوان یک دارایی ملی در مبارزه این کشور برای برتری هوش مصنوعی دفاع کردهاند. آقای لیانگ در 20 ژانویه به همراه تعدادی دیگر از کارآفرینان به ملاقات با لی کیانگ، نخست وزیر چین دعوت شد.
با این حال، همانطور که ژانگ ژیوی از شرکت مدیریت سرمایه پینپوینت اشاره میکند، دستاوردهای دیپسیک از یکی از انبوه مؤسسات تحقیقاتی تحت حمایت دولت چین یا شرکتهای تحت کنترل دولت نشأت نگرفته است. به نظر میرسد آقای لیانگ بیشتر سهام دیپسیک را کنترل میکند و از صنعت سرمایهگذاری جسورانه تحت سلطه دولت چین دوری کرده است.
آقای لیانگ نقش چین در 30 سال گذشته را به عنوان یک "پیرو" فناوری، بر اساس پایههای توسعه یافته در غرب میبیند. آقای لیانگ در مصاحبهای با رسانههای محلی در ماه جولای گفت که شکاف بین آمریکا و چین بین "اصالت و تقلید" است. او استدلال میکند که موفقیت انویدیا تنها به عملکرد خود متکی نبوده است، بلکه به همکاریهای فناوری بین شرکتهای غربی نیز وابسته بوده است. به نظر او، تلاشهای چین برای تقلید از قدرت محاسباتی غرب ناکام بوده است، زیرا علیرغم تلاشهای سرمایهبر تحت رهبری دولت برای ایجاد آن، فاقد این نوع همکاری است. دیپسیک ممکن است نه تنها برای غرب، بلکه برای رهبران چین در پکن نیز زنگ بیدارباش باشد. ¦