مدلها و ابزارهای هوش مصنوعی جدید ساخته شده برای کدنویسی
Gemini گوگل با تواناییهای کدنویسی خود در حال
OpenAI (با در نظر گرفتن اینکه در حال حاضر بیش از
روز چهارشنبه، OpenAI مدلهای o3 و o4-mini را راهاندازی کرد. این مدلها برای تفکر طولانیتر قبل از ارائه خروجی آموزش داده شدهاند. O3 یک مدل استدلالی است و o4-mini یک مدل کوچکتر است که برای استدلال سریع و مقرون به صرفه بهینه شده است.
این مدلهای استدلالی میتوانند از تواناییهای مختلفی مانند جستجو در وب، تجزیه و تحلیل فایلهای آپلود شده و سایر دادهها با پایتون و تولید تصاویر، همه از داخل ChatGPT، استفاده کنند.
OpenAI اشاره کرد که مدلهایش در تستهایی مانند کد مسابقه Codeforces نسبت به مدلهای قبلی خود به امتیازات معیار بالاتری دست مییابند و به گفته کارشناسان خارجی، ۲۰ درصد خطاهای عمده کمتری نسبت به OpenAI o1 دارند.
تستهای معیار برای کدنویسی شامل SWE-Lancer، SWE-Bench Verified Software Engineering و Aider Polygot Code Editing بود.
محدود به تستهای داخلی خود نیست، جدول امتیازات کدنویسی چند زبانه Aider، o3 را از نظر دقت در صدر قرار میدهد. در حالی که نمودار جدول امتیازات به بالاتر بودن قیمت نسبت به Gemini اشاره میکند، o4-mini هنوز ارزانتر از Claude 3.7 Sonnet و o1 است.
قبل از مدلهای استدلالی، در ۱۴ آوریل، OpenAI سری
OpenAI علاوه بر بهبود مدلها، Codex CLI را منتشر کرد، یک عامل کدنویسی متنباز و سبک وزن که میتواند از ترمینال شما اجرا شود و تحت مجوز Apache-2.0 در دسترس است.
اگرچه این یک پروژه آزمایشی است، اما شرکتهای قابل توجهی آن را آزمایش کردهاند که نشان دهنده قابلیت استفاده آن برای توسعهدهندگان است. Cloudflare نشان داد که چگونه از OpenAI Codex برای استقرار یک برنامه کامل Cloudflare Workers در عرض چند دقیقه استفاده کند.
برخی از توسعهدهندگان از ماهیت متنباز این ابزار قدردانی کردهاند، که آن را یک مزیت نسبت به گزینههایی مانند
OpenAI به پلتفرمهای برنامهنویسی حرفهای چشم دوخته است
بر اساس گزارش بلومبرگ، OpenAI قصد دارد Windsurf را با حدود ۳ میلیارد دلار خریداری کند.
اگر این درست باشد، OpenAI با پلتفرمهای کدنویسی هوش مصنوعی، از جمله VS Code مایکروسافت، Claude Code و سایرین رقابت خواهد کرد. این امر رقابت با Anthropic را نیز باز خواهد کرد.
فراموش نکنیم که در سال ۲۰۲۳، OpenAI برای کمک به بهبود Cursor، ۸ میلیون دلار سرمایهگذاری کرد. مشخص نیست که آیا OpenAI قصد رقابت با Cursor را دارد یا بعداً با آن شریک میشود، اما این شرکت به طور بالقوه در تلاش است تا در جنگ برنامهنویسی حرفهای شرکت کند.
با این حال، توسعهدهندگان نظر متفاوتی در مورد خرید احتمالی Windsurf توسط OpenAI دارند.
ادوارد روزگا، مهندس کارکنان در Prezi، به AIM گفت: من امروز صبح Codex را امتحان کردم، اما واقعاً آن را دوست ندارم. تا حدودی محدود است و UX ترمینال بدتر از Claude است.
وی افزود: هنوز در مورد Codex مطمئن نیستم. این احساس مانند رقیبی برای Claude Code است که مشکلاتی دارد. از یک کلید API استفاده میکند، بنابراین ممکن است صورتحساب زیادی با آن داشته باشید و آنها نشان نمیدهند که چقدر هزینه کردهاید. او تاکید کرد که فقط برای یک تماس ۳۰ سنت هزینه کرده است.
وقتی از او در مورد خرید Windsurf پرسیده شد، گفت: اگر OpenAI آن را بخرد و هزینههای LLM را یارانه دهد، میتواند یک حرکت بسیار بزرگ باشد و سهام در این بازار را افزایش دهد. او خاطرنشان کرد که این یک حرکت جسورانه با توجه به فشار اخیر مایکروسافت با حالت عامل GitHub Copilot خواهد بود.
پراسونا آناند، سازنده Zasper، نظرات خود را در این مورد به اشتراک گذاشت و به AIM گفت: جهان به
به همین ترتیب، سلیمان مدیمالا، بنیانگذار Bezu AI، به AIM گفت که OpenAI باید اعتماد توسعهدهندگان را جلب کند، مانند کاری که Anthropic با مدل Claude خود انجام داده است. او معتقد است که خرید احتمالی به تنهایی نمیتواند توسعهدهندگان را جذب کند.