DeepSeek AI از DeepSeek-V3-0324 رونمایی کرد: عملکرد فوق‌العاده سریع در مک استودیو، رقابت با OpenAI را داغ‌تر می‌کند

هوش مصنوعی (AI) در سال‌های اخیر گام‌های بلندی برداشته است، اما چالش‌ها در دستیابی به مدل‌های کارآمد، مقرون‌به‌صرفه و با عملکرد بالا همچنان پابرجا هستند. توسعه مدل‌های زبان بزرگ (LLM) اغلب به منابع محاسباتی قابل توجه و سرمایه‌گذاری مالی هنگفتی نیاز دارد که می‌تواند برای بسیاری از سازمان‌ها بازدارنده باشد. علاوه بر این، اطمینان از اینکه این مدل‌ها دارای قابلیت‌های استدلال قوی هستند و می‌توانند به طور مؤثر بر روی سخت‌افزارهای مصرفی مستقر شوند، همچنان یک مانع است.

DeepSeek AI با انتشار DeepSeek-V3-0324، که یک ارتقاء قابل توجه برای مدل زبان بزرگ V3 خود است، مستقیماً به این چالش‌ها پرداخته است. این مدل جدید نه تنها عملکرد را بهبود می‌بخشد، بلکه با سرعت چشمگیر ۲۰ توکن در ثانیه روی یک دستگاه مصرفی مانند مک استودیو کار می‌کند. این پیشرفت رقابت با پیشگامان صنعت مانند OpenAI را تشدید می‌کند و تعهد DeepSeek به دسترسی‌پذیرتر و کارآمدتر کردن مدل‌های هوش مصنوعی با کیفیت بالا را نشان می‌دهد.

DeepSeek-V3-0324 چندین بهبود فنی نسبت به نسخه قبلی خود ارائه می‌دهد. به طور قابل توجهی، بهبودهای چشمگیری در قابلیت‌های استدلال نشان می‌دهد، به طوری که امتیازات بنچمارک افزایش‌های قابل توجهی را نشان می‌دهند:

  • MMLU-Pro: ۷۵.۹ ← ۸۱.۲ (۵.۳+)
  • GPQA: ۵۹.۱ ← ۶۸.۴ (۹.۳+)
  • AIME: ۳۹.۶ ← ۵۹.۴ (۱۹.۸+)
  • LiveCodeBench: ۳۹.۲ ← ۴۹.۲ (۱۰.۰+)

این بهبودها نشان‌دهنده درک و پردازش قوی‌تر وظایف پیچیده است. علاوه بر این، مهارت‌های توسعه وب فرانت‌اند مدل بهبود یافته و کد اجرایی‌تر و صفحات وب و رابط‌های بازی زیباتری تولید می‌کند. مهارت نوشتن به زبان چینی آن نیز پیشرفت‌هایی داشته و با سبک نوشتاری R1 همسو شده و کیفیت محتوای متوسط تا طولانی را بهبود بخشیده است. علاوه بر این، دقت فراخوانی تابع افزایش یافته و مشکلاتی را که در نسخه‌های قبلی وجود داشت برطرف کرده است.

انتشار DeepSeek-V3-0324 تحت مجوز MIT بر تعهد DeepSeek AI به همکاری متن‌باز تأکید دارد و به توسعه‌دهندگان در سراسر جهان اجازه می‌دهد تا بدون محدودیت‌های مجوزدهی محدودکننده، از این فناوری استفاده کرده و بر پایه آن بسازند. توانایی مدل در اجرای کارآمد روی دستگاه‌هایی مانند مک استودیو، با دستیابی به سرعت ۲۰ توکن در ثانیه، کاربرد عملی و کارایی آن را نشان می‌دهد. این سطح از عملکرد نه تنها هوش مصنوعی پیشرفته را در دسترس‌تر می‌کند، بلکه وابستگی به سخت‌افزارهای گران‌قیمت و تخصصی را نیز کاهش می‌دهد و در نتیجه مانع ورود بسیاری از کاربران و سازمان‌ها را پایین می‌آورد.

در نتیجه، انتشار DeepSeek-V3-0324 توسط DeepSeek AI نقطه عطف مهمی در چشم‌انداز هوش مصنوعی است. DeepSeek با پرداختن به چالش‌های کلیدی مربوط به عملکرد، هزینه و دسترسی، خود را به عنوان یک رقیب قدرتمند برای نهادهای مستقر مانند OpenAI معرفی کرده است. پیشرفت‌های فنی مدل و در دسترس بودن متن‌باز آن نویدبخش دموکراتیزه کردن بیشتر فناوری هوش مصنوعی، تقویت نوآوری و پذیرش گسترده‌تر در بخش‌های مختلف است.