حوزهای متحول شده
تغییرات فراگیر در توسعه نرمافزار شگفتانگیز است. این گزارش افتتاحیه عادتهای توسعهدهندگان، بر اساس دادههای Cursor، این تحول را در پنج موضوع اصلی نشان میدهد:
شتاب توسعهدهندگان. ما سرعت کدنویسی را که سال به سال دو برابر شده است، بررسی میکنیم. همچنین نشان میدهیم که درخواستهای پول (PRها) بزرگتر و عمیقتر میشوند و کدهای تولید شده توسط عاملهای هوش مصنوعی با نرخ بالاتری نسبت به گذشته از مرحله بازبینی عبور میکنند.
اقتصاد هوش. ما هفت خانواده مدل هوش مصنوعی را بر اساس هزینه به ازای هر خط کد و هزینه به ازای هر ارسال بنچمارک کردهایم که ناهمگونی گستردهای را در اقتصاد واحد (unit economics) آنها آشکار میکند.
شکاف کاربران قدرتمند. ما دریافتیم که در حالی که هوش مصنوعی منجر به افزایش گسترده بهرهوری میشود، این تغییر در ۱٪ برتر توسعهدهندگان بیشتر مشهود است.
افزایش بستر اطلاعاتی (Context). ما افزایش چشمگیر توکنهای ورودی و تغییر به سمت توکنهای خوانده شده از حافظه کش را نشان میدهیم که به عاملهای هوش مصنوعی حافظه کاری لازم برای انجام وظایف پیچیدهتر و تولید کدی با کیفیت بالاتر را میدهد.
گذار به اتوماسیون. در نهایت، ما بررسی میکنیم که چگونه عاملهای کدنویسی از ابزاری که توسط توسعهدهندگان فردی استفاده میشود، به یک سیستم کامل برای ساخت و نگهداری نرمافزار، اغلب به صورت خودکار، در حال تکامل هستند.
این گزارش یک نقطه مرجع دادهمحور برای درک وضعیت کنونی توسعه نرمافزار مبتنی بر عاملهای هوش مصنوعی و مسیر آینده آن فراهم میکند.
شتاب توسعهدهندگان
توسعهدهندگان هر هفته کد بیشتری اضافه میکنند و رشد آن از ابتدای سال ۲۰۲۶ شتاب گرفته است. اگرچه این یک معیار عالی نیست، اما یک مبنای جالب برای درک چگونگی تغییر کار توسعهدهندگان فراهم میکند.
افزایش خطوط کد اضافه شده به ازای هر درخواست پول (PR)
خطوط کد اضافه شده به ازای هر PR تقریباً ۲.۵ برابر نسبت به سال گذشته افزایش یافته و نرخ رشد آن در حال شتاب گرفتن است.
توسعهدهندگان در حال پذیرش واحدهای کاری بزرگتر هستند
درخواستهای پول (PRها) بزرگ، که به عنوان PRهای با حداقل ۱۰۰۰ خط تغییر تعریف میشوند، در حال رایجتر شدن هستند؛ زیرا توسعهدهندگان از هوش مصنوعی برای انجام واحدهای کاری بزرگتر در یک PR واحد استفاده میکنند. جالب است که شاهد جهش در مگا PRها در ژانویه ۲۰۲۶ هستیم، زمانی که بسیاری از توسعهدهندگان در حال آزمایش آخرین بهبودها در عاملها و مدلهای کدنویسی بودند.
جلسات عاملها در حال عمیقتر شدن هستند
تنها در دو ماه گذشته، میانگین فراخوانی ابزار در هر جلسه تقریباً ۳۰٪ افزایش یافته است. عاملهای کدنویسی در حال انجام کارهای پیچیدهتر، خواندن و ویرایش فایلها، جستجو در کد، اجرای دستورات شل و مرور وب با فرکانس بیشتری هستند.
کد تولید شده توسط هوش مصنوعی ماندگاری بیشتری دارد
از ابتدای سال ۲۰۲۶، سهم خطوط کد هوش مصنوعی پذیرفته شده که پس از ۶۰ دقیقه همچنان حضور دارند، از تقریباً ۷۶٪ به ۸۱٪ افزایش یافته است.
اقتصاد هوش
هزینه هر درخواست عامل هوش مصنوعی (AI agent request) در بین خانوادههای مدل تقریباً ۹ برابر متغیر است که نشان میدهد یک گردش کار یکسان میتواند بسته به مدل مورد استفاده، پروفایلهای هزینه بسیار متفاوتی داشته باشد.
هزینه به ازای هر خط کد پذیرفته شده، شکاف مدلها را کاهش میدهد
هزینه به ازای هر خط کد پذیرفته شده در بین خانوادههای مدل تقریباً ۷ برابر متفاوت است، در مقایسه با تقریباً ۹ برابر برای هزینه هر درخواست؛ این نشان میدهد که مدلهای با هزینه بالاتر تا حدی این تفاوت را با تولید کد پذیرفته شده بیشتر به ازای هر درخواست جبران میکنند.
مرز هزینه-کیفیت در حال تغییر است
این نمای بنچمارک، عملکرد مدلها را در مجموعه ارزیابی داخلی Cursor، یعنی CursorBench، در برابر میانگین هزینه وظیفه ترسیم میکند و نشان میدهد که مدلها در کجای مرز هزینه-کیفیت قرار دارند.
شکاف کاربران قدرتمند
ما مشاهده میکنیم که توسعهدهندگان در صدک ۹۰ (p90) از توسعهدهندگان میانه در تعداد مطلق خطوط کد اضافه شده در هفته فاصله بیشتری میگیرند، و کاربران در صدک ۹۹ (p99) حتی بیشتر در انتهای نمودار قرار دارند.
نابرابری در انتهای نمودار تشدید میشود
این نمای دیگری است که نشان میدهد چگونه شکاف کاربران قدرتمند در انتهای نمودار به شدت گسترش مییابد.
توسعهدهندگان در صدک ۹۹ (p99) 46 برابر بیشتر از کاربران فعال میانه خط کد تولید میکنند و ۱۵ برابر بیشتر از نویسندگان PR فعال میانه، PR ادغام میکنند، در حالی که کاربران در صدک ۹۰ (p90) تفاوتهای بزرگتری اما بسیار کمتر را نشان میدهند.
افزایش بستر اطلاعاتی (Context)
نسبت توکنهای ورودی به توکنهای خروجی به سرعت در حال افزایش است که نشان میدهد مدلها برای هر توکن تولیدی خود، بستر اطلاعاتی (context) بسیار بیشتری را مصرف میکنند. این تغییر نشان میدهد که مدلها قبل از تولید کد، کار بیشتری را از قبل انجام میدهند.
توکنهای ورودی اکنون بر حجم توکنهای غیر کش (non-cache) تسلط دارند
همین تغییر نسبی به سمت توکنهای ورودی در ترکیب توکنها نیز مشاهده میشود. توکنهای ورودی اکنون بیش از ۹۰٪ از حجم توکنهای ورودی-خروجی را تشکیل میدهند و بستر اطلاعاتی (context) را به بخش غالب استفاده از مدلهای غیر کش تبدیل میکنند.
بستر اطلاعاتی ورودی (input context) در حال تبدیل شدن به هزینه اصلی توکن است
توکنهای ورودی بر مصرف توکنها غالب هستند، اما تأثیر آنها بر هزینه توسط قیمت واحد پایینتر آنها تعدیل میشود.
با این حال، توکنهای ورودی به اکثریت هزینههای توکن معادل قیمت تبدیل شدهاند و از ابتدای سال از تقریباً نیمی از هزینههای توکن ورودی/خروجی به نزدیک به ۷۰٪ افزایش یافتهاند.
خواندن از کش (Cache-reads) بر فعالیت توکنها غالب است
داستان بستر اطلاعاتی (context) با شامل شدن کش، حتی بزرگتر میشود. توکنهای خوانده شده از کش بر کل فعالیت توکنها غالب هستند و نشان میدهند که چقدر کار عاملها اکنون به استفاده مجدد از بستر اطلاعاتی قبلی بستگی دارد، نه خواندن همه چیز از ابتدا. ما به طور مداوم هارنس عامل خود را برای بهترین کش کردن توکنها در بین مدلها و ارائهدهندگان بهبود میبخشیم.
گذار به سمت اتوماسیون
از ابتدای سال ۲۰۲۶، بیش از ۵ برابر تغییرات تولید شده توسط عاملهای هوش مصنوعی بدون نیاز به مرحله پذیرش دستی تفاوتها (diff acceptance step) به کامیتها رسیدهاند، که نشان میدهد توسعهدهندگان به عاملهای هوش مصنوعی برای انجام بخش بیشتری از کار در جریان کامیت اعتماد میکنند.
اتوماسیون در حال گسترش در گردش کارها است
هنوز زود است، اما اولین الگوهای خودکارسازی در حال آشکار شدن هستند. پذیرش اتوماسیونهای Cursor به سرعت در حال رشد است و بازبینی امنیتی به عنوان یک مورد استفاده قوی برای اتوماسیون ظاهر میشود.
حتی اخیراً، اجراهای SDK تقاضای اولیه را برای تبدیل زیرساخت عامل Cursor به یک پلتفرم قابل برنامهریزی که متناسب با نحوه ساخت نرمافزار هر شرکت است، نشان میدهد.
روششناسی
این گزارش بر اساس دادههای تجمیعشده محصول و مهندسی Cursor، از جمله استفاده از عاملهای هوش مصنوعی، مصرف توکن، تفاوتهای کد هوش مصنوعی پذیرفته شده، و فعالیت PRهای ادغامشده است.
اکثر نمودارهای سری زمانی از میانگینهای متحرک ۷ روزه، ۲۸ روزه یا ۳۰ روزه برای کاهش نویز کوتاهمدت و آسانتر کردن مشاهده روندهای جهتدار استفاده میکنند. معیارها به صورت تجمیعشده گزارش شدهاند و قصد دارند الگوهای گستردهای را در نحوه استفاده توسعهدهندگان از هوش مصنوعی برای ساخت نرمافزار نشان دهند.
این گزارش شامل دادههایی که کاربران تحت "حالت حریم خصوصی" از ارائه آنها صرفنظر کردهاند، از جمله حفظ نکردن هیچ دادهای (zero data retention) با ارائهدهندگان مدل، نمیشود.