مدل‌های زبانی بزرگ کارآمد
مدل‌های زبانی بزرگ کارآمد

درس‌هایی که DeepSeek در مورد هزینه و کارایی هوش مصنوعی به ما می‌آموزد

با لوگوی زیبای نهنگ خود، انتشار اخیر DeepSeek می‌توانست چیزی بیشتر از یک کپی ناشیانه دیگر از ChatGPT نباشد. چیزی که آن را بسیار خبرساز کرد - و سهام رقبا را دچار سقوط کرد - هزینه اندک ایجاد آن بود. این به طور موثری یک مانع در مفهوم ایالات متحده در مورد سرمایه گذاری برای آموزش یک مدل زبانی بزرگ (LLM) با عملکرد بالا ایجاد کرد.

گفته می شود که DeepSeek تنها 6 میلیون دلار برای آموزش مدل هوش مصنوعی خود هزینه کرده است. این را با گزارش 80 تا 100 میلیون دلاری که OpenAI برای Chat GPT-4 صرف کرده یا 1 میلیارد دلاری که برای GPT-5 کنار گذاشته اند، مقایسه کنید. DeepSeek این سطح از سرمایه گذاری را زیر سوال می برد و بازیکنان بزرگی مانند Nvidia - که ارزش سهام آن در یک روز 600 میلیارد دلار سقوط کرد - TSMC و Microsoft را در مورد دوام مالی طولانی مدت هوش مصنوعی نگران می کند. اگر آموزش مدل های هوش مصنوعی با هزینه بسیار کمتری از آنچه قبلا تصور می شد امکان پذیر باشد، این برای هزینه های هوش مصنوعی به طور کلی چه معنایی دارد؟

اگرچه اختلال DeepSeek منجر به بحث های مهمی شده است، اما به نظر می رسد برخی از نکات کلیدی در این هیاهو گم شده اند. با این حال، آنچه که این خبر به ارمغان می آورد، تمرکز بیشتر بر میزان هزینه نوآوری و تاثیر اقتصادی احتمالی هوش مصنوعی است. در اینجا سه ​​بینش مهم ناشی از این خبر وجود دارد:

1. برچسب قیمت 6 میلیون دلاری DeepSeek گمراه کننده است

شرکت ها باید هزینه کل مالکیت (TCO) زیرساخت خود را درک کنند. اگرچه برچسب قیمت 6 میلیون دلاری DeepSeek بسیار مورد توجه قرار گرفته است، اما این احتمالا فقط هزینه اجرای پیش آموزش آن است تا کل سرمایه گذاری آن. هزینه کل - نه تنها برای اجرا، بلکه برای ساخت و آموزش DeepSeek - احتمالا بسیار بالاتر است. شرکت تحلیلگر صنعت SemiAnalysis نشان داد که شرکت پشت DeepSeek 1.6 میلیارد دلار برای سخت افزار هزینه کرده است تا LLM خود را به واقعیت تبدیل کند. بنابراین، هزینه احتمالی جایی در وسط است.

هزینه واقعی هر چه که باشد، ظهور DeepSeek تمرکز بر نوآوری مقرون به صرفه را ایجاد کرده است که می تواند تحول آفرین باشد. نوآوری اغلب با محدودیت ها تحریک می شود و موفقیت DeepSeek بر روشی که نوآوری می تواند زمانی رخ دهد که تیم های مهندسی منابع خود را در مواجهه با محدودیت های دنیای واقعی بهینه می کنند، تاکید می کند.

2. استنتاج چیزی است که هوش مصنوعی را ارزشمند می کند، نه آموزش

توجه به میزان هزینه آموزش مدل هوش مصنوعی مهم است، اما آموزش بخش کوچکی از هزینه کلی برای ساخت و اجرای یک مدل هوش مصنوعی را نشان می دهد. استنتاج — روش های متعددی که هوش مصنوعی نحوه کار، تعامل و زندگی مردم را تغییر می دهد — جایی است که هوش مصنوعی واقعاً ارزشمند می شود.

این پارادوکس Jevons را مطرح می کند، یک نظریه اقتصادی که نشان می دهد با پیشرفت های تکنولوژیکی استفاده از یک منبع را کارآمدتر می کند، مصرف کلی آن منبع ممکن است در واقع افزایش یابد. به عبارت دیگر، با کاهش هزینه های آموزش، مصرف استنتاج و عامل افزایش می یابد و هزینه کلی نیز به دنبال آن افزایش می یابد.

کارایی هوش مصنوعی ممکن است، در واقع، منجر به افزایش هزینه های هوش مصنوعی شود، که باید همه قایق ها را بالا ببرد، نه فقط قایق های چینی. با فرض اینکه آنها سوار بر موج کارایی شوند، شرکت هایی مانند OpenAI و Nvidia نیز سود خواهند برد.

3. آنچه که همچنان صادق است این است که اقتصاد واحد از همه مهمتر است

کارآمدتر کردن هوش مصنوعی صرفاً به معنای کاهش هزینه ها نیست. بلکه به معنای بهینه سازی اقتصاد واحد نیز هست. Motley Fool پیش بینی می کند که امسال سال کارایی هوش مصنوعی خواهد بود. اگر حق با آنها باشد، شرکت ها باید به کاهش هزینه های آموزش هوش مصنوعی و همچنین هزینه های مصرف هوش مصنوعی خود توجه کنند.

سازمان هایی که هوش مصنوعی را می سازند یا از آن استفاده می کنند، باید اقتصاد واحد خود را بشناسند تا اینکه ارقام چشمگیر مانند هزینه آموزش 6 میلیون دلاری DeepSeek را برجسته کنند. کارایی واقعی مستلزم تخصیص همه هزینه ها، ردیابی تقاضای ناشی از هوش مصنوعی و نظارت دائمی بر هزینه به ارزش است.

اقتصاد واحد ابری (CUE) به اندازه گیری و به حداکثر رساندن سود ناشی از ابر مربوط می شود. CUE هزینه های ابری شما را با معیارهای درآمد و تقاضا مقایسه می کند و نشان می دهد که هزینه های ابری شما چقدر کارآمد است، چگونه در طول زمان تغییر کرده است و (اگر پلتفرم مناسبی دارید) بهترین راه ها برای افزایش این کارایی چیست.

درک CUE حتی در یک زمینه هوش مصنوعی کاربرد بیشتری دارد، با توجه به اینکه ذاتاً مصرف آن گران تر از خدمات ابری سنتی است که توسط هایپرسکیلرها فروخته می شود. شرکت هایی که برنامه های کاربردی عامل را می سازند می توانند هزینه خود را در هر تراکنش محاسبه کنند (به عنوان مثال هزینه در هر قبض، هزینه در هر تحویل، هزینه در هر تجارت و غیره) و از این برای ارزیابی بازگشت سرمایه خدمات، محصولات و ویژگی های خاص مبتنی بر هوش مصنوعی استفاده کنند. با افزایش هزینه های هوش مصنوعی، شرکت ها مجبور به انجام این کار خواهند شد. هیچ شرکتی نمی تواند دلار بی پایان را برای نوآوری تجربی برای همیشه پرتاب کند. در نهایت، باید از نظر تجاری منطقی باشد.

به سوی کارایی بیشتر

هر چقدر هم که رقم 6 میلیون دلاری معنادار باشد، DeepSeek ممکن است لحظه مهمی را فراهم کرده باشد که صنعت فناوری را از اهمیت اجتناب ناپذیر کارایی بیدار می کند. امیدواریم این امر دریچه های سد را برای آموزش، استنتاج و برنامه های عامل مقرون به صرفه باز کند که پتانسیل واقعی و ROI هوش مصنوعی را باز می کند.