گزارش عادت‌های توسعه‌دهندگان Cursor

بهار ۲۰۲۶

حوزه‌ای متحول شده

تغییرات فراگیر در توسعه نرم‌افزار شگفت‌انگیز است. این گزارش افتتاحیه عادت‌های توسعه‌دهندگان، بر اساس داده‌های Cursor، این تحول را در پنج موضوع اصلی نشان می‌دهد:

  1. شتاب توسعه‌دهندگان. ما سرعت کدنویسی را که سال به سال دو برابر شده است، بررسی می‌کنیم. همچنین نشان می‌دهیم که درخواست‌های پول (PRها) بزرگ‌تر و عمیق‌تر می‌شوند و کدهای تولید شده توسط عامل‌های هوش مصنوعی با نرخ بالاتری نسبت به گذشته از مرحله بازبینی عبور می‌کنند.

  2. اقتصاد هوش. ما هفت خانواده مدل هوش مصنوعی را بر اساس هزینه به ازای هر خط کد و هزینه به ازای هر ارسال بنچمارک کرده‌ایم که ناهمگونی گسترده‌ای را در اقتصاد واحد (unit economics) آن‌ها آشکار می‌کند.

  3. شکاف کاربران قدرتمند. ما دریافتیم که در حالی که هوش مصنوعی منجر به افزایش گسترده بهره‌وری می‌شود، این تغییر در ۱٪ برتر توسعه‌دهندگان بیشتر مشهود است.

  4. افزایش بستر اطلاعاتی (Context). ما افزایش چشمگیر توکن‌های ورودی و تغییر به سمت توکن‌های خوانده شده از حافظه کش را نشان می‌دهیم که به عامل‌های هوش مصنوعی حافظه کاری لازم برای انجام وظایف پیچیده‌تر و تولید کدی با کیفیت بالاتر را می‌دهد.

  5. گذار به اتوماسیون. در نهایت، ما بررسی می‌کنیم که چگونه عامل‌های کدنویسی از ابزاری که توسط توسعه‌دهندگان فردی استفاده می‌شود، به یک سیستم کامل برای ساخت و نگهداری نرم‌افزار، اغلب به صورت خودکار، در حال تکامل هستند.

این گزارش یک نقطه مرجع داده‌محور برای درک وضعیت کنونی توسعه نرم‌افزار مبتنی بر عامل‌های هوش مصنوعی و مسیر آینده آن فراهم می‌کند.

شتاب توسعه‌دهندگان

توسعه‌دهندگان هر هفته کد بیشتری اضافه می‌کنند و رشد آن از ابتدای سال ۲۰۲۶ شتاب گرفته است. اگرچه این یک معیار عالی نیست، اما یک مبنای جالب برای درک چگونگی تغییر کار توسعه‌دهندگان فراهم می‌کند.

افزایش خطوط کد اضافه شده به ازای هر درخواست پول (PR)

خطوط کد اضافه شده به ازای هر PR تقریباً ۲.۵ برابر نسبت به سال گذشته افزایش یافته و نرخ رشد آن در حال شتاب گرفتن است.

توسعه‌دهندگان در حال پذیرش واحدهای کاری بزرگ‌تر هستند

درخواست‌های پول (PRها) بزرگ، که به عنوان PRهای با حداقل ۱۰۰۰ خط تغییر تعریف می‌شوند، در حال رایج‌تر شدن هستند؛ زیرا توسعه‌دهندگان از هوش مصنوعی برای انجام واحدهای کاری بزرگ‌تر در یک PR واحد استفاده می‌کنند. جالب است که شاهد جهش در مگا PRها در ژانویه ۲۰۲۶ هستیم، زمانی که بسیاری از توسعه‌دهندگان در حال آزمایش آخرین بهبودها در عامل‌ها و مدل‌های کدنویسی بودند.

جلسات عامل‌ها در حال عمیق‌تر شدن هستند

تنها در دو ماه گذشته، میانگین فراخوانی ابزار در هر جلسه تقریباً ۳۰٪ افزایش یافته است. عامل‌های کدنویسی در حال انجام کارهای پیچیده‌تر، خواندن و ویرایش فایل‌ها، جستجو در کد، اجرای دستورات شل و مرور وب با فرکانس بیشتری هستند.

کد تولید شده توسط هوش مصنوعی ماندگاری بیشتری دارد

از ابتدای سال ۲۰۲۶، سهم خطوط کد هوش مصنوعی پذیرفته شده که پس از ۶۰ دقیقه همچنان حضور دارند، از تقریباً ۷۶٪ به ۸۱٪ افزایش یافته است.

اقتصاد هوش

هزینه هر درخواست عامل هوش مصنوعی (AI agent request) در بین خانواده‌های مدل تقریباً ۹ برابر متغیر است که نشان می‌دهد یک گردش کار یکسان می‌تواند بسته به مدل مورد استفاده، پروفایل‌های هزینه بسیار متفاوتی داشته باشد.

هزینه به ازای هر خط کد پذیرفته شده، شکاف مدل‌ها را کاهش می‌دهد

هزینه به ازای هر خط کد پذیرفته شده در بین خانواده‌های مدل تقریباً ۷ برابر متفاوت است، در مقایسه با تقریباً ۹ برابر برای هزینه هر درخواست؛ این نشان می‌دهد که مدل‌های با هزینه بالاتر تا حدی این تفاوت را با تولید کد پذیرفته شده بیشتر به ازای هر درخواست جبران می‌کنند.

مرز هزینه-کیفیت در حال تغییر است

این نمای بنچمارک، عملکرد مدل‌ها را در مجموعه ارزیابی داخلی Cursor، یعنی CursorBench، در برابر میانگین هزینه وظیفه ترسیم می‌کند و نشان می‌دهد که مدل‌ها در کجای مرز هزینه-کیفیت قرار دارند.

شکاف کاربران قدرتمند

ما مشاهده می‌کنیم که توسعه‌دهندگان در صدک ۹۰ (p90) از توسعه‌دهندگان میانه در تعداد مطلق خطوط کد اضافه شده در هفته فاصله بیشتری می‌گیرند، و کاربران در صدک ۹۹ (p99) حتی بیشتر در انتهای نمودار قرار دارند.

نابرابری در انتهای نمودار تشدید می‌شود

این نمای دیگری است که نشان می‌دهد چگونه شکاف کاربران قدرتمند در انتهای نمودار به شدت گسترش می‌یابد.

توسعه‌دهندگان در صدک ۹۹ (p99) 46 برابر بیشتر از کاربران فعال میانه خط کد تولید می‌کنند و ۱۵ برابر بیشتر از نویسندگان PR فعال میانه، PR ادغام می‌کنند، در حالی که کاربران در صدک ۹۰ (p90) تفاوت‌های بزرگ‌تری اما بسیار کمتر را نشان می‌دهند.

افزایش بستر اطلاعاتی (Context)

نسبت توکن‌های ورودی به توکن‌های خروجی به سرعت در حال افزایش است که نشان می‌دهد مدل‌ها برای هر توکن تولیدی خود، بستر اطلاعاتی (context) بسیار بیشتری را مصرف می‌کنند. این تغییر نشان می‌دهد که مدل‌ها قبل از تولید کد، کار بیشتری را از قبل انجام می‌دهند.

توکن‌های ورودی اکنون بر حجم توکن‌های غیر کش (non-cache) تسلط دارند

همین تغییر نسبی به سمت توکن‌های ورودی در ترکیب توکن‌ها نیز مشاهده می‌شود. توکن‌های ورودی اکنون بیش از ۹۰٪ از حجم توکن‌های ورودی-خروجی را تشکیل می‌دهند و بستر اطلاعاتی (context) را به بخش غالب استفاده از مدل‌های غیر کش تبدیل می‌کنند.

بستر اطلاعاتی ورودی (input context) در حال تبدیل شدن به هزینه اصلی توکن است

توکن‌های ورودی بر مصرف توکن‌ها غالب هستند، اما تأثیر آن‌ها بر هزینه توسط قیمت واحد پایین‌تر آن‌ها تعدیل می‌شود.

با این حال، توکن‌های ورودی به اکثریت هزینه‌های توکن معادل قیمت تبدیل شده‌اند و از ابتدای سال از تقریباً نیمی از هزینه‌های توکن ورودی/خروجی به نزدیک به ۷۰٪ افزایش یافته‌اند.

خواندن از کش (Cache-reads) بر فعالیت توکن‌ها غالب است

داستان بستر اطلاعاتی (context) با شامل شدن کش، حتی بزرگ‌تر می‌شود. توکن‌های خوانده شده از کش بر کل فعالیت توکن‌ها غالب هستند و نشان می‌دهند که چقدر کار عامل‌ها اکنون به استفاده مجدد از بستر اطلاعاتی قبلی بستگی دارد، نه خواندن همه چیز از ابتدا. ما به طور مداوم هارنس عامل خود را برای بهترین کش کردن توکن‌ها در بین مدل‌ها و ارائه‌دهندگان بهبود می‌بخشیم.

گذار به سمت اتوماسیون

از ابتدای سال ۲۰۲۶، بیش از ۵ برابر تغییرات تولید شده توسط عامل‌های هوش مصنوعی بدون نیاز به مرحله پذیرش دستی تفاوت‌ها (diff acceptance step) به کامیت‌ها رسیده‌اند، که نشان می‌دهد توسعه‌دهندگان به عامل‌های هوش مصنوعی برای انجام بخش بیشتری از کار در جریان کامیت اعتماد می‌کنند.

اتوماسیون در حال گسترش در گردش کارها است

هنوز زود است، اما اولین الگوهای خودکارسازی در حال آشکار شدن هستند. پذیرش اتوماسیون‌های Cursor به سرعت در حال رشد است و بازبینی امنیتی به عنوان یک مورد استفاده قوی برای اتوماسیون ظاهر می‌شود.

حتی اخیراً، اجراهای SDK تقاضای اولیه را برای تبدیل زیرساخت عامل Cursor به یک پلتفرم قابل برنامه‌ریزی که متناسب با نحوه ساخت نرم‌افزار هر شرکت است، نشان می‌دهد.

روش‌شناسی

این گزارش بر اساس داده‌های تجمیع‌شده محصول و مهندسی Cursor، از جمله استفاده از عامل‌های هوش مصنوعی، مصرف توکن، تفاوت‌های کد هوش مصنوعی پذیرفته شده، و فعالیت PRهای ادغام‌شده است.

اکثر نمودارهای سری زمانی از میانگین‌های متحرک ۷ روزه، ۲۸ روزه یا ۳۰ روزه برای کاهش نویز کوتاه‌مدت و آسان‌تر کردن مشاهده روندهای جهت‌دار استفاده می‌کنند. معیارها به صورت تجمیع‌شده گزارش شده‌اند و قصد دارند الگوهای گسترده‌ای را در نحوه استفاده توسعه‌دهندگان از هوش مصنوعی برای ساخت نرم‌افزار نشان دهند.

این گزارش شامل داده‌هایی که کاربران تحت "حالت حریم خصوصی" از ارائه آن‌ها صرف‌نظر کرده‌اند، از جمله حفظ نکردن هیچ داده‌ای (zero data retention) با ارائه‌دهندگان مدل، نمی‌شود.