موج دوم کدنویسی هوش مصنوعی اینجاست

از افرادی که در حال ساخت هوش مصنوعی مولد هستند بپرسید که هوش مصنوعی مولد در حال حاضر برای چه کاری خوب است - چیزی که واقعاً آنها را هیجان زده می‌کنند - بسیاری به شما خواهند گفت: کدنویسی.

جرد کاپلان، دانشمند ارشد در آنتروپیک، در مصاحبه‌ای با MIT Technology Review در این ماه گفت: «این چیزی است که برای توسعه‌دهندگان بسیار هیجان‌انگیز بوده است: این واقعاً درک این است که مشکل کد چیست، اشکال‌زدایی آن.»

کوپایلوت، ابزاری که بر روی مدل‌های زبانی بزرگ OpenAI ساخته شده و توسط گیت‌هاب تحت حمایت مایکروسافت در سال ۲۰۲۲ راه‌اندازی شد، اکنون توسط میلیون‌ها توسعه‌دهنده در سراسر جهان استفاده می‌شود. میلیون‌ها نفر دیگر برای کمک‌های روزمره به چت‌بات‌های همه‌منظوره مانند کلود (Claude) آنتروپیک، چت‌جی‌پی‌تی (ChatGPT) اوپن‌ای‌آی و جمینای (Gemini) گوگل دیپ‌مایند روی می‌آورند.

سوندار پیچای، مدیرعامل آلفابت، در یک تماس تلفنی در ماه اکتبر مدعی شد: «امروزه، بیش از یک چهارم تمام کدهای جدید در گوگل توسط هوش مصنوعی تولید می‌شود، سپس توسط مهندسان بررسی و پذیرفته می‌شود. این به مهندسان ما کمک می‌کند تا کارهای بیشتری انجام دهند و سریع‌تر حرکت کنند.» انتظار می‌رود که سایر شرکت‌های فناوری نیز، اگر قبلاً این کار را نکرده باشند، به این روند برسند.

تنها غول‌های بزرگ نیستند که ابزارهای کدنویسی هوش مصنوعی را عرضه می‌کنند. تعدادی از استارت‌آپ‌های جدید نیز وارد این بازار پرهیاهو شده‌اند. تازه‌واردانی مانند Zencoder، Merly، Cosine، Tessl (که ظرف چند ماه پس از راه‌اندازی ۷۵۰ میلیون دلار ارزش‌گذاری شد) و Poolside (که حتی قبل از انتشار محصول، ۳ میلیارد دلار ارزش‌گذاری شد) همگی برای سهم خود از این بازار رقابت می‌کنند. ناتان بنایچ، تحلیلگر شرکت سرمایه‌گذاری Air Street Capital، می‌گوید: «در واقع به نظر می‌رسد که توسعه‌دهندگان مایل به پرداخت هزینه برای کوپایلوت‌ها هستند و بنابراین کد یکی از ساده‌ترین راه‌ها برای کسب درآمد از هوش مصنوعی است.»

چنین شرکت‌هایی وعده می‌دهند که دستیارهای کدنویسی مولد را به سطح بالاتری برسانند. به جای ارائه نوعی تکمیل خودکار فوق‌العاده به توسعه‌دهندگان، مانند اکثر ابزارهای موجود، این نسل بعدی می‌تواند کد را نمونه‌سازی، آزمایش و اشکال‌زدایی کند. نتیجه این است که توسعه‌دهندگان اساساً می‌توانند به مدیرانی تبدیل شوند که ممکن است زمان بیشتری را صرف بررسی و تصحیح کد نوشته شده توسط یک مدل کنند تا اینکه خودشان آن را از ابتدا بنویسند.

اما این همه ماجرا نیست. بسیاری از افرادی که دستیارهای کدنویسی مولد را می‌سازند، فکر می‌کنند که این دستیارها می‌توانند مسیری سریع به سوی هوش مصنوعی عمومی (AGI)، فناوری فرضی فراانسانی که تعدادی از شرکت‌های برتر ادعا می‌کنند در چشم‌انداز خود دارند، باشند.

ایزو کانت، مدیرعامل و یکی از بنیانگذاران Poolside می‌گوید: «اولین باری که شاهد یک فعالیت اقتصادی بسیار ارزشمند خواهیم بود که به قابلیت‌های سطح انسانی رسیده است، در توسعه نرم‌افزار خواهد بود.» (OpenAI قبلاً به خود می‌بالید که آخرین مدل o3 خود، دانشمند ارشد شرکت را در یک چالش کدنویسی رقابتی شکست داده است.)

به موج دوم کدنویسی هوش مصنوعی خوش آمدید.

کد صحیح

مهندسان نرم‌افزار در مورد دو نوع صحت صحبت می‌کنند. یک نوع صحت مربوط به نحو (گرامر) یک برنامه است - به این معنی که تمام کلمات، اعداد و عملگرهای ریاضی در جای درست قرار دارند. این موضوع بسیار مهم‌تر از صحت دستوری در زبان طبیعی است. اگر یک چیز کوچک در هزاران خط کد اشتباه باشد، هیچ‌کدام از آن‌ها اجرا نمی‌شوند.

نسل اول دستیارهای کدنویسی اکنون در تولید کدهایی که از این نظر صحیح هستند، بسیار خوب عمل می‌کنند. آنها با آموزش بر روی میلیاردها قطعه کد، ساختارهای سطحی بسیاری از انواع برنامه‌ها را جذب کرده‌اند.

اما نوع دیگری از صحت نیز وجود دارد که مربوط به عملکرد یک برنامه است: مطمئناً، برنامه اجرا می‌شود، اما آیا واقعاً همان کاری را انجام می‌دهد که شما می‌خواستید؟ این سطح دوم از صحت است که موج جدید دستیارهای کدنویسی مولد به دنبال آن هستند - و چیزی است که واقعاً نحوه ساخت نرم‌افزار را تغییر خواهد داد.

آلیستر پولن، یکی از بنیانگذاران Cosine، می‌گوید: «مدل‌های زبانی بزرگ می‌توانند کدی بنویسند که کامپایل می‌شود، اما ممکن است همیشه برنامه‌ای را که شما می‌خواستید ننویسند. برای انجام این کار، باید فرآیندهای فکری‌ای را که یک کدنویس انسانی برای رسیدن به آن نتیجه نهایی طی کرده است، بازسازی کنید.»

مشکل این است که داده‌هایی که اکثر دستیارهای کدنویسی بر روی آن‌ها آموزش دیده‌اند - میلیاردها قطعه کد گرفته شده از مخازن آنلاین - این فرآیندهای فکری را ثبت نمی‌کنند. این داده‌ها محصول نهایی را نشان می‌دهند، نه آنچه برای ساخت آن صرف شده است. کانت می‌گوید: «کدهای زیادی وجود دارد، اما این داده‌ها نشان‌دهنده توسعه نرم‌افزار نیستند.»

آنچه پولن، کانت و دیگران دریافته‌اند این است که برای ساخت مدلی که کارهای بسیار بیشتری از تکمیل خودکار انجام می‌دهد - مدلی که می‌تواند برنامه‌های مفیدی ارائه دهد، آنها را آزمایش کند و اشکالات را برطرف کند - باید چیزهای بسیار بیشتری از کد را به آن نشان دهید. باید نحوه کنار هم قرار گرفتن آن کد را به آن نشان دهید.

هدف ساخت مدل‌هایی است که نه تنها از ظاهر کد خوب - چه خوب کار کند چه نه - تقلید می‌کنند، بلکه از فرآیندی که چنین کدی را در وهله اول تولید می‌کند، تقلید می‌کنند.

ردپاها

برای انجام این کار، به مجموعه‌ای از داده‌ها نیاز دارید که این فرآیند را ثبت کند - مراحلی که یک توسعه‌دهنده انسانی ممکن است هنگام نوشتن کد طی کند. این مراحل را به عنوان مسیری از ردپاها در نظر بگیرید که یک ماشین می‌تواند برای تولید یک قطعه کد مشابه، آن را دنبال کند.

ابتدا باید مشخص کنید که از چه موادی استفاده کنید: کدام بخش از کد موجود - و هر منبع اطلاعاتی دیگر - برای یک وظیفه برنامه‌نویسی خاص مورد نیاز است؟ اندرو فیلف، بنیانگذار Zencoder، می‌گوید: «زمینه بسیار مهم است. نسل اول ابزارها در زمینه بسیار ضعیف عمل می‌کردند، آنها اساساً فقط به برگه‌های باز شما نگاه می‌کردند. اما مخزن کد شما ممکن است ۵۰۰۰ فایل داشته باشد و آنها بیشتر آن را از دست می‌دادند.»

Zencoder تعدادی از متخصصان موتور جستجو را استخدام کرده است تا به آن در ساخت ابزاری کمک کنند که بتواند پایگاه‌های کد بزرگ را تجزیه و تحلیل کند و بفهمد چه چیزی مرتبط است و چه چیزی نیست. فیلف می‌گوید: این زمینه دقیق، توهمات را کاهش می‌دهد و کیفیت کدی را که مدل‌های زبانی بزرگ می‌توانند تولید کنند، بهبود می‌بخشد: «ما آن را گروکینگ مخزن می‌نامیم.»

Cosine نیز فکر می‌کند که زمینه کلیدی است. این شرکت در حال جمع‌آوری هر ردپایی است که می‌تواند پیدا کند و از آنها برای ایجاد نوع جدیدی از مجموعه داده استفاده می‌کند. این شرکت از ده‌ها کدنویس خواسته است تا آنچه را که در حین کار بر روی صدها وظیفه برنامه‌نویسی مختلف انجام می‌دادند، ثبت کنند. پولن می‌گوید: «ما از آنها خواستیم همه چیز را بنویسند: چرا آن فایل را باز کردید؟ چرا تا نیمه آن را پیمایش کردید؟ چرا آن را بستید؟» آنها همچنین از کدنویسان خواستند تا قطعات کد تمام شده را حاشیه‌نویسی کنند و بخش‌هایی را که برای نوشتن به دانش سایر قطعات کد یا مستندات خاص نیاز دارند، علامت‌گذاری کنند.

سپس Cosine تمام این اطلاعات را می‌گیرد و یک مجموعه داده مصنوعی بزرگ تولید می‌کند که مراحل معمولی کدنویسان و منابع اطلاعاتی‌ای را که آنها استفاده می‌کنند، به قطعات کد تمام شده نگاشت می‌کند. آنها از این مجموعه داده برای آموزش مدلی استفاده می‌کنند تا بفهمد چه مسیری از ردپاها را ممکن است برای تولید یک برنامه خاص نیاز داشته باشد دنبال کند و سپس چگونه آن را دنبال کند.

Poolside، مستقر در سانفرانسیسکو، همچنین در حال ایجاد یک مجموعه داده مصنوعی است که فرآیند کدنویسی را ثبت می‌کند، اما بیشتر بر روی تکنیکی به نام RLCE - یادگیری تقویتی از اجرای کد - تکیه می‌کند. (Cosine نیز از این روش استفاده می‌کند، اما به میزان کمتر.)

RLCE مشابه تکنیکی است که برای ساخت چت‌بات‌هایی مانند ChatGPT به عنوان مکالمه‌کننده‌های ماهر استفاده می‌شود، که به عنوان RLHF - یادگیری تقویتی از بازخورد انسانی شناخته می‌شود. با RLHF، یک مدل آموزش داده می‌شود تا متنی تولید کند که بیشتر شبیه نوعی باشد که آزمایش‌کنندگان انسانی می‌گویند ترجیح می‌دهند. با RLCE، یک مدل آموزش داده می‌شود تا کدی تولید کند که بیشتر شبیه نوعی باشد که وقتی اجرا می‌شود (یا اجرا می‌شود) کاری را که قرار است انجام دهد، انجام می‌دهد.

بازی با سیستم

Cosine و Poolside هر دو می‌گویند که از رویکردی که DeepMind با مدل بازی AlphaZero خود در پیش گرفت، الهام گرفته‌اند. به AlphaZero مراحلی که می‌توانست بردارد - حرکات در یک بازی - داده شد و سپس به حال خود رها شد تا بارها و بارها در برابر خودش بازی کند و از طریق آزمون و خطا بفهمد که کدام توالی حرکات، حرکات برنده هستند و کدام‌ها نیستند.

پنگ‌مینگ وانگ، دانشمند موسس در Poolside، با اشاره به استاد بزرگ کره‌ای گو که AlphaZero در سال ۲۰۱۶ او را شکست داد، می‌گوید: «آنها به آن اجازه دادند تا حرکات را در هر نوبت ممکن کشف کند، هر تعداد بازی که می‌توانید به آن محاسبات اختصاص دهید را شبیه‌سازی کنید - این منجر به شکست لی سدول شد.» وانگ پیش از Poolside، در گوگل دیپ‌مایند روی کاربردهای AlphaZero فراتر از بازی‌های رومیزی، از جمله FunSearch، نسخه‌ای که برای حل مسائل ریاضی پیشرفته آموزش دیده بود، کار می‌کرد.

وقتی این رویکرد AlphaZero برای کدنویسی اعمال می‌شود، مراحل دخیل در تولید یک قطعه کد به حرکات موجود در یک بازی تبدیل می‌شوند و یک برنامه صحیح به برنده شدن در آن بازی تبدیل می‌شود. اگر یک مدل به حال خود رها شود تا بازی کند، می‌تواند بسیار سریع‌تر از یک انسان پیشرفت کند. کانت می‌گوید: «یک کدنویس انسانی یک بار شکست می‌خورد و یک بار شکست می‌خورد. مدل‌ها می‌توانند ۱۰۰ بار به طور همزمان چیزهایی را امتحان کنند.»

یک تفاوت کلیدی بین Cosine و Poolside این است که Cosine از یک نسخه سفارشی GPT-4o ارائه شده توسط OpenAI استفاده می‌کند، که آموزش بر روی مجموعه داده بزرگتری را نسبت به مدل پایه امکان‌پذیر می‌کند، اما Poolside در حال ساخت مدل زبانی بزرگ خود از ابتدا است.

کانت از Poolside فکر می‌کند که آموزش یک مدل بر روی کد از ابتدا نتایج بهتری نسبت به تطبیق یک مدل موجود که نه تنها میلیاردها قطعه کد بلکه بیشتر اینترنت را بلعیده است، خواهد داشت. او می‌گوید: «من کاملاً موافقم که مدل ما آناتومی پروانه را فراموش کند.»

Cosine ادعا می‌کند که دستیار کدنویسی مولد آن، به نام Genie، در صدر جدول امتیازات SWE-Bench، مجموعه‌ای استاندارد از تست‌ها برای مدل‌های کدنویسی قرار دارد. Poolside هنوز در حال ساخت مدل خود است، اما ادعا می‌کند که آنچه تاکنون دارد با عملکرد کوپایلوت گیت‌هاب مطابقت دارد.

کانت می‌گوید: «من شخصاً اعتقاد بسیار قوی‌ای دارم که مدل‌های زبانی بزرگ ما را به جایی می‌رسانند که به اندازه یک توسعه‌دهنده نرم‌افزار توانا باشیم.»

با این حال، همه این دیدگاه را ندارند.

مدل‌های زبانی بزرگ غیرمنطقی

از نظر جاستین گاتشلیچ، مدیرعامل و بنیانگذار Merly، مدل‌های زبانی بزرگ ابزار اشتباهی برای این کار هستند - تمام. او به سگش اشاره می‌کند: «هیچ مقدار آموزشی برای سگ من هرگز او را قادر به کدنویسی نمی‌کند، این اتفاق نمی‌افتد. او می‌تواند انواع کارهای دیگر را انجام دهد، اما او فقط قادر به آن سطح عمیق شناختی نیست.»

گاتشلیچ که بیش از یک دهه روی تولید کد کار کرده است، نقطه گیر مشابهی با مدل‌های زبانی بزرگ دارد. برنامه‌نویسی نیاز به توانایی کار کردن با پازل‌های منطقی با دقت بی‌وقفه دارد. او می‌گوید، مهم نیست که مدل‌های زبانی بزرگ چقدر خوب یاد بگیرند که از کاری که برنامه‌نویسان انسانی انجام می‌دهند تقلید کنند، در هسته خود هنوز اساساً ماشین‌های اسلات آماری هستند: «من نمی‌توانم یک سیستم غیرمنطقی را طوری آموزش دهم که منطقی شود.»

به جای آموزش یک مدل زبانی بزرگ برای تولید کد با تغذیه آن با مثال‌های فراوان، Merly اصلاً کد نوشته شده توسط انسان را به سیستم خود نشان نمی‌دهد. گاتشلیچ استدلال می‌کند که برای ساخت واقعی مدلی که بتواند کد تولید کند، باید در سطح منطق زیربنایی‌ای که کد نشان می‌دهد کار کنید، نه خود کد. بنابراین سیستم Merly بر روی یک نمایش میانی آموزش داده می‌شود - چیزی شبیه نماد قابل خواندن توسط ماشین که اکثر زبان‌های برنامه‌نویسی قبل از اجرا به آن ترجمه می‌شوند.

گاتشلیچ نمی‌گوید که این دقیقاً چه شکلی است یا این فرآیند چگونه کار می‌کند. اما او یک قیاس را مطرح می‌کند: این ایده در ریاضیات وجود دارد که تنها اعدادی که باید وجود داشته باشند، اعداد اول هستند، زیرا می‌توانید تمام اعداد دیگر را با استفاده از اعداد اول محاسبه کنید. او می‌گوید: «این مفهوم را بگیرید و آن را در مورد کد اعمال کنید.»

این رویکرد نه تنها مستقیماً به منطق برنامه‌نویسی می‌پردازد، بلکه سریع نیز هست، زیرا میلیون‌ها خط کد قبل از اینکه سیستم آنها را تجزیه و تحلیل کند، به چند هزار خط زبان میانی کاهش می‌یابد.

تغییر ذهنیت‌ها

نظر شما در مورد این رویکردهای رقیب ممکن است به این بستگی داشته باشد که می‌خواهید دستیارهای کدنویسی مولد چه باشند.

در ماه نوامبر، Cosine مهندسان خود را از استفاده از ابزارهایی غیر از محصولات خود منع کرد. اکنون این شرکت شاهد تأثیر Genie بر مهندسان خود است که اغلب خود را در حال تماشای ابزاری می‌بینند که برای آنها کد تولید می‌کند. یانگ لی، یکی دیگر از بنیانگذاران Cosine، می‌گوید: «اکنون شما نتیجه‌ای را که می‌خواهید به مدل می‌دهید و او پیش می‌رود و در مورد پیاده‌سازی آن برای شما نگران می‌شود.»

پولن اعتراف می‌کند که این می‌تواند گیج‌کننده باشد و نیاز به تغییر ذهنیت داشته باشد. او می‌گوید: «ما مهندسانی داریم که چندین کار را به طور همزمان انجام می‌دهند و بین پنجره‌ها جابه‌جا می‌شوند. در حالی که Genie در حال اجرای کد در یکی از پنجره‌ها است، ممکن است آنها در پنجره دیگری به آن دستور دهند تا کار دیگری انجام دهد.»

این ابزارها همچنین امکان نمونه‌سازی چندین نسخه از یک سیستم را به طور همزمان فراهم می‌کنند. فرض کنید در حال توسعه نرم‌افزاری هستید که به یک سیستم پرداخت داخلی نیاز دارد. می‌توانید از یک دستیار کدنویسی بخواهید که به طور همزمان چندین گزینه مختلف - Stripe، Mango، Checkout - را امتحان کند، به جای اینکه مجبور باشید آنها را یک به یک با دست کدنویسی کنید.

می‌توان Genie را به حال خود رها کرد تا شبانه‌روز اشکالات را برطرف کند. اکثر تیم‌های نرم‌افزاری از ابزارهای گزارش اشکال استفاده می‌کنند که به افراد امکان می‌دهد توضیحات خطاهایی را که با آنها مواجه شده‌اند، بارگذاری کنند. Genie می‌تواند این توضیحات را بخواند و راه‌حل‌هایی ارائه دهد. سپس یک انسان فقط باید قبل از به‌روزرسانی پایگاه کد، آنها را بررسی کند.

لی می‌گوید: «هیچ انسانی به تنهایی تریلیون‌ها خط کد در بزرگترین سیستم‌های نرم‌افزاری امروزی را درک نمی‌کند و هر چه نرم‌افزارهای بیشتری توسط نرم‌افزارهای دیگر نوشته شوند، میزان کد فقط بیشتر می‌شود.»

این امر دستیارهای کدنویسی‌ای را که این کد را برای ما نگهداری می‌کنند، ضروری می‌کند. لی می‌گوید: «تنگنا این خواهد بود که انسان‌ها با چه سرعتی می‌توانند کد تولید شده توسط ماشین را بررسی کنند.»

مهندسان Cosine در مورد این موضوع چه احساسی دارند؟ به گفته پولن، حداقل، خوب است. او می‌گوید: «اگر من یک مشکل سخت به شما بدهم، شما همچنان در مورد اینکه چگونه می‌خواهید آن مشکل را برای مدل توصیف کنید، فکر خواهید کرد. به جای نوشتن کد، باید آن را به زبان طبیعی بنویسید. اما هنوز هم فکر زیادی در این مورد وجود دارد، بنابراین شما واقعاً لذت مهندسی را از بین نمی‌برید. خارش هنوز برطرف می‌شود.»

برخی ممکن است سریع‌تر از دیگران سازگار شوند. Cosine دوست دارد از افراد متقاضی استخدام دعوت کند تا چند روز را با تیم خود کدنویسی کنند. چند ماه پیش، این شرکت از یکی از این کاندیداها خواست تا ویجتی بسازد که به کارمندان اجازه دهد تکه‌های جالبی از نرم‌افزاری را که روی آن کار می‌کنند در رسانه‌های اجتماعی به اشتراک بگذارند.

این وظیفه ساده‌ای نبود و نیاز به دانش کاری چندین بخش از میلیون‌ها خط کد Cosine داشت. اما این کاندیدا آن را در عرض چند ساعت انجام داد. لی می‌گوید: «این شخصی که هرگز پایگاه کد ما را ندیده بود، روز دوشنبه آمد و تا بعدازظهر سه‌شنبه چیزی را ارسال کرده بود. ما فکر می‌کردیم که این کار تمام هفته او را خواهد گرفت.» (آنها او را استخدام کردند.)

اما زاویه دیگری نیز وجود دارد. بسیاری از شرکت‌ها از این فناوری برای کاهش تعداد برنامه‌نویسانی که استخدام می‌کنند، استفاده خواهند کرد. لی فکر می‌کند که به زودی شاهد سطوحی از مهندسان نرم‌افزار خواهیم بود. در یک طرف، توسعه‌دهندگان نخبه‌ای با حقوق‌های میلیون دلاری وجود خواهند داشت که می‌توانند مشکلات را زمانی که هوش مصنوعی اشتباه می‌کند، تشخیص دهند. در طرف دیگر، تیم‌های کوچکتری متشکل از ۱۰ تا ۲۰ نفر کاری را انجام خواهند داد که زمانی به صدها کدنویس نیاز داشت. لی می‌گوید: «این مانند این خواهد بود که چگونه دستگاه‌های خودپرداز بانکداری را متحول کردند.»

او می‌گوید: «هر کاری که بخواهید انجام دهید، با محاسبات تعیین می‌شود و نه تعداد نفرات. فکر می‌کنم به طور کلی پذیرفته شده است که دوران اضافه کردن چند هزار مهندس دیگر به سازمان شما به پایان رسیده است.»

موتورهای وارپ

در واقع، از نظر گاتشلیچ، ماشین‌هایی که می‌توانند بهتر از انسان‌ها کدنویسی کنند، ضروری خواهند بود. از نظر او، این تنها راهی است که ما سیستم‌های نرم‌افزاری عظیم و پیچیده‌ای را که او فکر می‌کند در نهایت به آنها نیاز خواهیم داشت، خواهیم ساخت. مانند بسیاری از افراد در سیلیکون ولی، او آینده‌ای را پیش‌بینی می‌کند که در آن انسان‌ها به سیارات دیگر نقل مکان می‌کنند. او می‌گوید: «این تنها در صورتی امکان‌پذیر خواهد بود که ما هوش مصنوعی را وادار کنیم تا نرم‌افزار مورد نیاز را بسازد: هدف واقعی Merly این است که ما را به مریخ برساند.»

گاتشلیچ ترجیح می‌دهد به جای «دستیاران کدنویسی» در مورد «برنامه‌نویسی ماشینی» صحبت کند، زیرا فکر می‌کند این اصطلاح مشکل را به شکل اشتباهی بیان می‌کند. او می‌گوید: «من فکر نمی‌کنم که این سیستم‌ها باید به انسان‌ها کمک کنند - من فکر می‌کنم انسان‌ها باید به آنها کمک کنند. آنها می‌توانند با سرعت هوش مصنوعی حرکت کنند. چرا پتانسیل آنها را محدود کنیم؟»

گاتشلیچ می‌گوید: «این کارتون به نام عصر حجر وجود دارد که در آن ماشین‌هایی دارند، اما فقط زمانی حرکت می‌کنند که رانندگان از پاهای خود استفاده می‌کنند. این تقریباً همان حسی است که من فکر می‌کنم اکثر مردم در مورد هوش مصنوعی برای سیستم‌های نرم‌افزاری دارند.»

او می‌افزاید: «اما چیزی که Merly می‌سازد، اساساً، سفینه‌های فضایی است.» او شوخی نمی‌کند. «و من فکر نمی‌کنم سفینه‌های فضایی باید توسط انسان‌هایی که روی دوچرخه هستند، نیرو بگیرند. سفینه‌های فضایی باید توسط یک موتور وارپ نیرو بگیرند.»

اگر این غیرعادی به نظر می‌رسد - همینطور است. اما نکته مهمی در مورد اینکه افرادی که این فناوری را می‌سازند، فکر می‌کنند هدف نهایی واقعاً چیست، وجود دارد.

گاتشلیچ با این دیدگاه کهکشانی خود، یک استثنا نیست. با وجود تمرکز آنها بر محصولاتی که توسعه‌دهندگان می‌خواهند امروزه از آنها استفاده کنند، اکثر این شرکت‌ها به دنبال سود بسیار بزرگتری هستند. از وب‌سایت Cosine دیدن کنید و این شرکت خود را به عنوان «آزمایشگاه استدلال انسانی» معرفی می‌کند. این شرکت کدنویسی را تنها به عنوان اولین قدم به سوی یک مدل همه‌منظوره‌تر می‌بیند که می‌تواند حل مسئله انسانی را در تعدادی از حوزه‌ها تقلید کند.

Poolside اهداف مشابهی دارد: این شرکت صراحتاً بیان می‌کند که در حال ساخت AGI است. کانت می‌گوید: «کد راهی برای رسمی کردن استدلال است.»

وانگ به عامل‌ها اشاره می‌کند. او می‌گوید، تصور کنید سیستمی که می‌تواند نرم‌افزار خود را برای انجام هر کاری در لحظه راه‌اندازی کند. «اگر به نقطه‌ای برسید که عامل شما واقعاً بتواند هر وظیفه محاسباتی‌ای را که می‌خواهید از طریق نرم‌افزار حل کند - این اساساً نمایشی از AGI است.»

در اینجا روی زمین، چنین سیستم‌هایی یک رویا باقی می‌مانند. در عین حال، مهندسی نرم‌افزار سریع‌تر از آنچه بسیاری در لبه پیشرفت انتظار داشتند، در حال تغییر است.

پولن از Cosine می‌گوید: «ما در نقطه‌ای نیستیم که همه چیز توسط ماشین‌ها انجام شود، اما قطعاً در حال دور شدن از نقش معمول یک مهندس نرم‌افزار هستیم. ما جرقه‌های آن جریان کار جدید را می‌بینیم - اینکه مهندس نرم‌افزار بودن در آینده به چه معناست.»

https://www.technologyreview.com/2025/01/20/1110180/the-second-wave-of-ai-coding-is-here/