لیزی ویلسون، محقق، در یک آلگوریو در لندن اجرا می‌کند. اعتبار عکس: جاناتان رئوس
لیزی ویلسون، محقق، در یک آلگوریو در لندن اجرا می‌کند. اعتبار عکس: جاناتان رئوس

چگونه هوش مصنوعی می‌تواند خلاقیت را تقویت کند

گاهی اوقات لیزی ویلسون با دستیار هوش مصنوعی خود در یک ریو (rave) ظاهر می‌شود.

یک شب در هفته در ماه فوریه گذشته، ویلسون لپ‌تاپ خود را به یک پروژکتور وصل کرد که صفحه نمایش او را روی دیوار یک فضای زیرشیروانی با سقف کوتاه در شرق لندن انداخت. جمعیت کوچکی در درخشش نورهای صورتی کم‌نور به داخل هجوم آوردند. ویلسون نشست و شروع به برنامه‌نویسی کرد.

صداهای کلیک و وزوز تکنو از بلندگوهای محل پخش می‌شد. تماشاگران با تکان دادن سرها تماشا می‌کردند که ویلسون خط به خط کد را روی صفحه نمایش داده شده تایپ می‌کند—صداها را تغییر می‌دهد، ضرب‌ها را حلقه می‌کند و وقتی اشتباه می‌کرد، چهره‌اش در هم می‌رفت.

ویلسون یک کدنویس زنده است. کدنویس‌های زنده به جای استفاده از نرم‌افزارهای ویژه مانند اکثر تهیه‌کنندگان موسیقی الکترونیک، با نوشتن کد برای تولید آن در لحظه، موسیقی خلق می‌کنند. این یک هنر اجرایی بداهه است که به عنوان آلگوریو شناخته می‌شود.

او می‌گوید: «وقتی می‌روید نمایشی را تماشا کنید و کسی فقط آنجا روی لپ‌تاپش نشسته باشد، کمی خسته‌کننده است. «می‌توانید از موسیقی لذت ببرید، اما یک جنبه اجرایی وجود دارد که از دست رفته است. با کدنویسی زنده، همه می‌توانند ببینند که من چه چیزی را تایپ می‌کنم. و وقتی لپ‌تاپ من خراب شده است، مردم واقعاً آن را دوست دارند. شروع به تشویق می‌کنند.»

ریسک کردن بخشی از حال و هوا است. بنابراین ویلسون دوست دارد با بداهه‌نوازی بر اساس چیزی که آن را یک عامل کدنویسی زنده می‌نامد، یک مدل هوش مصنوعی مولد که ضرب‌ها و حلقه‌های خود را برای افزودن به ترکیب ارائه می‌دهد، اجراهای خود را یک پله دیگر بالا ببرد. اغلب این مدل ترکیب‌های صوتی را پیشنهاد می‌دهد که ویلسون به آن‌ها فکر نکرده بود. او می‌گوید: «شما این عناصر غافلگیری را دریافت می‌کنید. «فقط باید برای آن تلاش کنید.»

دو اجراکننده در یک میز با یک گربه اخمو پوشیده از کد روی یک صفحه نمایش در پشت سر آن‌ها
جشنواره آدلا

ویلسون، محقق موسسه محاسبات خلاق در دانشگاه هنر لندن، تنها یکی از بسیاری از افرادی است که روی چیزی کار می‌کنند که به عنوان خلاقیت مشترک یا خلاقیت فرابشری شناخته می‌شود. ایده این است که از هوش مصنوعی می‌توان برای الهام بخشیدن یا نقد پروژه‌های خلاقانه استفاده کرد و به افراد کمک کرد تا چیزهایی را بسازند که به تنهایی نمی‌توانستند بسازند. او و همکارانش عامل کدنویسی زنده را ساختند تا بررسی کنند که چگونه می‌توان از هوش مصنوعی برای حمایت از تلاش‌های هنری انسان استفاده کرد—در مورد ویلسون، بداهه‌نوازی موسیقی.

این دیدگاهی است که فراتر از وعده ابزارهای مولد موجود که توسط شرکت‌هایی مانند OpenAI و Google DeepMind ارائه شده‌اند، می‌رود. این ابزارها می‌توانند طیف قابل توجهی از وظایف خلاقانه را خودکار کنند و رضایت تقریباً فوری را ارائه دهند—اما به چه قیمتی؟ برخی از هنرمندان و محققان می‌ترسند که چنین فناوری‌هایی بتوانند ما را به مصرف‌کنندگان منفعل انبوهی از هوش مصنوعی تبدیل کنند.

بنابراین آن‌ها به دنبال راه‌هایی برای تزریق مجدد خلاقیت انسانی به این فرآیند هستند. هدف این است که ابزارهای هوش مصنوعی را توسعه دهیم که خلاقیت ما را افزایش دهند نه اینکه آن را از ما سلب کنند—ما را به سمت بهتر شدن در آهنگسازی موسیقی، توسعه بازی‌ها، طراحی اسباب‌بازی‌ها و موارد دیگر سوق دهند—و زمینه‌ای را برای آینده‌ای فراهم کنند که در آن انسان‌ها و ماشین‌ها با هم چیزهایی را خلق می‌کنند.

در نهایت، مدل‌های مولد می‌توانند رسانه‌ای کاملاً جدید را به هنرمندان و طراحان ارائه دهند، آن‌ها را به سمت ساختن چیزهایی سوق دهند که قبلاً نمی‌توانستند ساخته شوند و به همه ابرقدرت‌های خلاقانه بدهند.

انفجار خلاقیت

هیچ راه واحدی برای خلاق بودن وجود ندارد، اما همه ما آن را انجام می‌دهیم. ما همه چیز را از میم‌ها گرفته تا شاهکارها، از نقاشی‌های کودکانه گرفته تا طرح‌های صنعتی می‌سازیم. یک باور اشتباه، معمولاً در بین بزرگسالان، وجود دارد که خلاقیت چیزی است که از آن بزرگ می‌شوید. اما خلاق بودن—چه آشپزی، چه آواز خواندن در حمام یا سرهم کردن تیک‌تاک‌های فوق‌العاده عجیب—هنوز هم چیزی است که بیشتر ما فقط برای تفریح انجام می‌دهیم. لازم نیست هنر والا یا یک ایده تغییردهنده جهان باشد (و با این حال می‌تواند باشد). خلاقیت رفتار اساسی انسان است؛ باید جشن گرفته شود و تشویق شود.

هنگامی که مدل‌های مولد متن به تصویر مانند Midjourney، DALL-E شرکت OpenAI و Stable Diffusion متن‌باز محبوب از راه رسیدند، انفجاری از چیزی را به وجود آوردند که بسیار شبیه خلاقیت بود. میلیون‌ها نفر اکنون قادر بودند تصاویر قابل توجهی از تقریباً هر چیزی را در هر سبکی با کلیک یک دکمه ایجاد کنند. مدل‌های متن به ویدیو در مرحله بعدی قرار گرفتند. اکنون استارت‌آپ‌هایی مانند Udio در حال توسعه ابزارهای مشابهی برای موسیقی هستند. هرگز قبل از این ثمرات آفرینش در دسترس بسیاری نبوده است.

اما برای تعدادی از محققان و هنرمندان، هیاهوی پیرامون این ابزارها ایده واقعی خلاقیت را تحریف کرده است. جبا رِزوانا، که در دانشگاه تاوسون در مریلند روی خلاقیت مشترک کار می‌کند، می‌گوید: «اگر از هوش مصنوعی بخواهم چیزی را برای من خلق کند، این من نیستم که خلاق هستم. «این یک تعامل یک‌باره است: شما روی آن کلیک می‌کنید و چیزی تولید می‌کند و تمام. نمی‌توانید بگویید "این قسمت را دوست دارم، اما شاید چیزی را اینجا تغییر دهید". نمی‌توانید یک گفتگوی رفت و برگشتی داشته باشید.»

رزوانا به نحوه تنظیم بیشتر مدل‌های مولد اشاره می‌کند. می‌توانید به ابزارها بازخورد بدهید و از آن‌ها بخواهید که دوباره تلاش کنند. اما هر نتیجه جدید از ابتدا تولید می‌شود، که می‌تواند رسیدن به دقیقاً آنچه می‌خواهید را دشوار کند. همانطور که فیلمساز والتر وودمن سال گذشته پس از اینکه مجموعه هنری او Shy Kids یک فیلم کوتاه با مدل متن به ویدیوی OpenAI برای اولین بار ساخت، گفت: «Sora یک ماشین اسلات است که چه چیزی به دست می‌آورید.»

علاوه بر این، آخرین نسخه‌های برخی از این ابزارهای مولد حتی از درخواست ارسالی شما به همان صورت برای تولید تصویر یا ویدیو استفاده نمی‌کنند (حداقل در تنظیمات پیش‌فرض آن‌ها). قبل از اینکه یک درخواست به مدل ارسال شود، نرم‌افزار آن را ویرایش می‌کند—اغلب با افزودن ده‌ها کلمه پنهان—تا احتمال اینکه تصویر تولید شده صیقلی به نظر برسد، بیشتر شود.

مایک کوک، محقق خلاقیت محاسباتی در کینگز کالج لندن، می‌گوید: «چیزهای اضافی برای تقویت خروجی اضافه می‌شوند. «سعی کنید از Midjourney بخواهید که یک نقاشی بد از چیزی به شما بدهد—نمی‌تواند آن را انجام دهد.» این ابزارها آنچه را که می‌خواهید به شما نمی‌دهند. آن‌ها آنچه را که طراحانشان فکر می‌کنند می‌خواهید به شما می‌دهند.

مایک کوک
با حسن نیت از مایک کوک

نیک برایان-کینز، همچنین در موسسه محاسبات خلاق، می‌گوید: «همه این‌ها خوب است اگر فقط به یک تصویر سریع نیاز دارید و زیاد به جزئیات اهمیت نمی‌دهید: "شاید بخواهید یک کارت کریسمس برای خانواده خود یا یک آگهی برای فروش کیک محلی خود درست کنید. این ابزارها برای این کار عالی هستند."»

به طور خلاصه، مدل‌های مولد موجود ایجاد را آسان کرده‌اند، اما خلاق بودن را آسان نکرده‌اند. و تفاوت بزرگی بین این دو وجود دارد. برای کوک، تکیه بر چنین ابزارهایی در واقع می‌تواند به توسعه خلاقانه افراد در درازمدت آسیب برساند. او در مقاله‌ای که سال گذشته منتشر شد، نوشت: «اگرچه بسیاری از این سیستم‌های هوش مصنوعی خلاق به عنوان ابزارهایی برای دسترسی بیشتر به خلاقیت تبلیغ می‌شوند،» اما ممکن است در عوض «اثرات نامطلوبی بر کاربران خود از نظر محدود کردن توانایی آن‌ها در نوآوری، ایده‌پردازی و ایجاد داشته باشند.» با توجه به اینکه چقدر مدل‌های مولد برای قرار دادن توانایی‌های خلاقانه در دسترس همه مورد تحسین قرار گرفته‌اند، این پیشنهاد که آن‌ها در واقع ممکن است برعکس عمل کنند، محکوم‌کننده است.

تصویر از بازی با اره‌های همپوشانی
در بازی Disc Room، بازیکنان یک اتاق پر از اره‌های گردان متحرک را هدایت می‌کنند. DEVOLVER DIGITAL
تصویر از بازی تولید شده توسط هوش مصنوعی با اره‌های کوچک
کوک از هوش مصنوعی برای طراحی یک سطح جدید برای بازی استفاده کرد. نتیجه یک اتاق بود که هیچ یک از دیسک‌ها در واقع حرکت نمی‌کردند. با حسن نیت از مایک کوک

او تنها محققی نیست که نگران تأثیر شناختی این فناوری‌ها است. در ماه فوریه، تیمی در Microsoft Research Cambridge گزارشی منتشر کرد که نتیجه می‌گیرد ابزارهای هوش مصنوعی مولد «می‌توانند تعامل انتقادی با کار را مهار کنند و به طور بالقوه منجر به تکیه بیش از حد در درازمدت به ابزار و کاهش مهارت در حل مسئله مستقل شوند.» محققان دریافتند که با استفاده از ابزارهای مولد، تلاش افراد «از اجرای کار به مباشرت کار تغییر می‌کند.»

کوک نگران است که ابزارهای مولد به شما اجازه شکست نمی‌دهند—بخشی حیاتی از یادگیری مهارت‌های جدید. کوک می‌گوید ما عادت داریم بگوییم که هنرمندان با استعداد هستند. اما حقیقت این است که هنرمندان روی هنر خود کار می‌کنند و مهارت‌ها را در طول ماه‌ها و سال‌ها توسعه می‌دهند.

او می‌گوید: «اگر واقعاً با هنرمندان صحبت کنید، آن‌ها می‌گویند: "خب، من با انجام آن بارها و بارها و بارها خوب شدم." "اما شکست خوردن مزخرف است. و ما همیشه به دنبال راه‌هایی برای دور زدن آن هستیم."»

مدل‌های مولد به ما اجازه می‌دهند از ناامیدی انجام یک کار بد صرف نظر کنیم.

کوک می‌گوید: «متأسفانه، ما تنها چیزی را که برای توسعه مهارت‌های خلاقانه برای خودتان باید انجام دهید، حذف می‌کنیم، که شکست خوردن است. "اما هیچ کس مطلقاً نمی‌خواهد آن را بشنود."»

من را غافلگیر کن

با این حال، همه چیز خبر بد نیست. هنرمندان و محققان از راه‌هایی که ابزارهای مولد می‌توانند به سازندگان قدرت دهند، هیجان‌زده هستند، آن‌ها را به سمت مسیرهای جدید غافلگیرکننده سوق می‌دهند و آن‌ها را از بن‌بست‌ها دور می‌کنند. کوک فکر می‌کند که وعده واقعی هوش مصنوعی این خواهد بود که به ما کمک کند در کارهایی که می‌خواهیم انجام دهیم بهتر شویم تا اینکه آن را برای ما انجام دهد. او می‌گوید، برای این کار، ما باید ابزارهای جدیدی ایجاد کنیم، متفاوت از ابزارهایی که اکنون داریم. او می‌گوید: «استفاده از Midjourney هیچ کاری برای من انجام نمی‌دهد—هیچ چیزی را در مورد من تغییر نمی‌دهد. "و من فکر می‌کنم این یک فرصت هدر رفته است."»

از طیف وسیعی از محققانی که در حال مطالعه خلاقیت هستند بخواهید که بخشی کلیدی از فرآیند خلاقانه را نام ببرند، بسیاری خواهند گفت: تأمل. تعریف دقیق آن دشوار است، اما تأمل نوع خاصی از تفکر متمرکز و سنجیده است. این همان چیزی است که وقتی یک ایده جدید به شما می‌رسد اتفاق می‌افتد. یا زمانی که فرضی که داشتید اشتباه از آب در می‌آید و نیاز دارید رویکرد خود را دوباره ارزیابی کنید. این برخلاف یک تعامل یک‌باره است.

جستجوی راه‌هایی که هوش مصنوعی می‌تواند از تأمل حمایت یا تشویق کند—درخواست از آن برای پرتاب ایده‌های جدید به ترکیب یا به چالش کشیدن ایده‌هایی که از قبل دارید—یک نخ مشترک در سراسر تحقیقات خلاقیت مشترک است. اگر ابزارهای مولد مانند DALL-E ایجاد را بدون اصطکاک می‌کنند، هدف در اینجا این است که اصطکاک را دوباره به آن اضافه کنیم. الیسا گیاکاردی، که در دانشگاه پلی‌تکنیک میلان در ایتالیا به مطالعه طراحی می‌پردازد، می‌پرسد: «چگونه می‌توانیم هنر را بدون اصطکاک بسازیم؟ "چگونه می‌توانیم بدون ماده‌ای که به عقب هل می‌دهد، در یک فرآیند خلاقانه واقعی شرکت کنیم؟"»

عامل کدنویسی زنده ویلسون را در نظر بگیرید. او ادعا می‌کند که بداهه‌نوازی موسیقی او را در جهت‌هایی سوق می‌دهد که شاید به تنهایی نمی‌توانست برود. این مدل که بر روی کد عمومی به اشتراک گذاشته شده توسط جامعه گسترده‌تر کدنویسی زنده آموزش داده شده است، قطعه کدهایی را پیشنهاد می‌کند که به سبک‌های دیگران نزدیک‌تر از سبک خود او هستند. این باعث می‌شود که احتمال تولید چیزی غیرمنتظره بیشتر شود. او می‌گوید: «نه به این دلیل که نمی‌توانید خودتان آن را تولید کنید. "اما روش کار مغز انسان به این صورت است که شما تمایل دارید به ایده‌های تکراری بازگردید."»

سال گذشته، ویلسون در مطالعه‌ای شرکت کرد که توسط برایان-کینز و همکارانش انجام شد که در آن آن‌ها از شش نوازنده با تجربه در حین استفاده از انواع مدل‌های مولد برای کمک به آن‌ها در ساخت یک قطعه موسیقی نظرسنجی کردند. محققان می‌خواستند درک درستی از این داشته باشند که چه نوع تعاملاتی با این فناوری مفید هستند و کدام یک مفید نیستند.

همه شرکت‌کنندگان گفتند که دوست دارند وقتی مدل‌ها پیشنهادات غافلگیرکننده‌ای ارائه می‌دهند، حتی زمانی که این پیشنهادات نتیجه اشکالات یا اشتباهات هستند. گاهی اوقات نتایج به سادگی بهتر بودند. گاهی اوقات این فرآیند تازه و هیجان‌انگیز به نظر می‌رسید. اما چند نفر با دست کشیدن از کنترل مشکل داشتند. هدایت مدل‌ها برای تولید نتایج خاص یا تکرار نتایجی که نوازندگان دوست داشتند، دشوار بود. برایان-کینز می‌گوید: «از جهاتی این شبیه به بودن در یک گروه است. "شما باید آن حس خطر و حس غافلگیری را داشته باشید، اما نمی‌خواهید کاملاً تصادفی باشد."»

طرح‌های جایگزین

کوک از زاویه دیگری به غافلگیری می‌پردازد: او بینش‌های غیرمنتظره را از ابزارهای هوش مصنوعی که برای ایجاد مشترک بازی‌های ویدیویی توسعه داده است، بیرون می‌کشد. یکی از ابزارهای او، Puck، که اولین بار در سال 2022 منتشر شد، طرح‌هایی را برای بازی‌های پازل تطبیق شکل ساده مانند Candy Crush یا Bejeweled تولید می‌کند. بسیاری از طرح‌های Puck آزمایشی و ناشیانه هستند—انتظار نداشته باشید که چیزی را ارائه دهد که احتمالاً هرگز بازی خواهید کرد. اما نکته این نیست: کوک از Puck—و ابزار جدیدتری به نام Pixie—برای بررسی این موضوع استفاده می‌کند که افراد ممکن است بخواهند چه نوع تعاملاتی با یک ابزار خلاقانه مشترک داشته باشند.

Pixie می‌تواند کد کامپیوتر را برای یک بازی بخواند و خطوط خاصی را تغییر دهد تا طرح‌های جایگزین ارائه دهد. چندی پیش، کوک روی یک نسخه از یک بازی محبوب به نام Disc Room کار می‌کرد که در آن بازیکنان باید از یک اتاق پر از اره‌های گردان متحرک عبور کنند. او از Pixie خواست تا به او کمک کند تا طرحی برای یک سطح ارائه دهد که بازیکنان ماهر و غیر ماهر آن را به یک اندازه دشوار بدانند. Pixie اتاقی را طراحی کرد که هیچ یک از دیسک‌ها در واقع حرکت نمی‌کردند. کوک می‌خندد: این چیزی نیست که او انتظار داشت. او می‌گوید: «اساساً اتاق را به یک میدان مین تبدیل کرد. "اما من فکر کردم واقعاً جالب است. من قبلاً به آن فکر نکرده بودم."»

آنه آرزبرگر
با حسن نیت از آنه آرزبرگر
یک تکشاخ عروسکی و مواد خیاطی
با حسن نیت از آنه آرزبرگر

آنه آرزبرگر، محقق دانشگاه فناوری دلفت در هلند، می‌گوید که پس زدن فرضیات یا به چالش کشیده شدن، بخشی از فرآیند خلاقانه است. او می‌گوید: «اگر به افرادی فکر کنم که با آن‌ها بهترین همکاری را داشته‌ام، آن‌ها کسانی نیستند که فقط به هر ایده‌ای که من مطرح می‌کردم می‌گفتند "بله، عالی است". "آن‌ها واقعاً انتقادی بودند و ایده‌های مخالفی داشتند."»

او می‌خواهد فناوری‌ای بسازد که یک تابلوی صدای مشابه ارائه دهد. آرزبرگر به عنوان بخشی از پروژه‌ای به نام Creating Monsters، دو ابزار هوش مصنوعی آزمایشی را توسعه داد که به طراحان کمک می‌کند تا تعصبات پنهان را در طرح‌های خود پیدا کنند. او می‌گوید: «من به راه‌هایی علاقه داشتم که بتوانم از این فناوری برای دسترسی به اطلاعاتی استفاده کنم که در غیر این صورت دسترسی به آن‌ها دشوار بود.»

برای این پروژه، او و همکارانش به مشکل طراحی فیگورهای اسباب‌بازی که از نظر جنسیتی خنثی باشند نگاه کردند. او و همکارانش (از جمله گیاکاردی) از Teachable Machine، یک برنامه وب که توسط محققان گوگل در سال 2017 ساخته شده است و آموزش مدل یادگیری ماشین خود را برای طبقه‌بندی ورودی‌های مختلف، مانند تصاویر، آسان می‌کند، استفاده کردند. آن‌ها این مدل را با چند ده تصویر آموزش دادند که آرزبرگر آن‌ها را به عنوان مردانه، زنانه یا از نظر جنسیتی خنثی برچسب‌گذاری کرده بود.

آرزبرگر سپس از این مدل خواست تا جنسیت طرح‌های اسباب‌بازی کاندیدای جدید را شناسایی کند. او دریافت که بسیاری از طرح‌ها زنانه تلقی می‌شوند، حتی زمانی که او سعی کرده بود آن‌ها را از نظر جنسیتی خنثی کند. او احساس کرد که دیدگاه‌های او از جهان—تعصبات پنهان خود او—در حال آشکار شدن است. اما این ابزار اغلب درست می‌گفت: این ابزار فرضیات او را به چالش کشید و به تیم کمک کرد تا طرح‌ها را بهبود بخشد. او می‌گوید، از همین رویکرد می‌توان برای ارزیابی انواع ویژگی‌های طراحی استفاده کرد.

آرزبرگر سپس از مدل دوم، نسخه‌ای از ابزاری که توسط استارت‌آپ تصویر و ویدیوی مولد Runway ساخته شده است، استفاده کرد تا طرح‌های اسباب‌بازی از نظر جنسیتی خنثی خود را ارائه دهد. ابتدا محققان این مدل را آموزش دادند تا طرح‌هایی را برای اسباب‌بازی‌هایی با ظاهر مردانه و زنانه تولید و طبقه‌بندی کند. سپس آن‌ها می‌توانستند از این ابزار بخواهند که طرحی را پیدا کند که دقیقاً در نیمه راه بین طرح‌های مردانه و زنانه ای باشد که آموخته است.

او می‌گوید، مدل‌های مولد می‌توانند بازخوردهایی را در مورد طرح‌هایی ارائه دهند که طراحان انسانی ممکن است خودشان از دست بدهند: «ما واقعاً می‌توانیم چیزی یاد بگیریم.»

تاریخچه فناوری مملو از پیشرفت‌هایی است که نحوه ساخت هنر را تغییر داده است، از دستور العمل‌های رنگ‌های جدید پر جنب و جوش گرفته تا عکاسی و سینتی‌سایزرها. در دهه 1960، جان چاونینگ، محقق استنفورد، سال‌ها روی یک الگوریتم باطنی کار کرد که می‌توانست فرکانس‌های صداهای تولید شده توسط کامپیوتر را دستکاری کند. استنفورد این فناوری را به Yamaha مجوز داد، که آن را در سینتی‌سایزرهای خود ساخت—از جمله DX7، صدای جدید جالب پشت آهنگ‌های دهه 1980 مانند "The Best" تینا ترنر، "Take On Me" آ-ها و "When Doves Cry" پرینس.

برایان-کینز مجذوب این است که چگونه هنرمندان و طراحان راه‌هایی برای استفاده از فناوری‌های جدید پیدا می‌کنند. او می‌گوید: «اگر با هنرمندان صحبت کنید، بیشتر آن‌ها در واقع در مورد این مدل‌های مولد هوش مصنوعی به عنوان یک ابزار صحبت نمی‌کنند—آن‌ها در مورد آن‌ها به عنوان یک ماده، مانند یک ماده هنری، مانند یک رنگ یا چیزی شبیه به آن صحبت می‌کنند. «این یک روش متفاوت برای فکر کردن در مورد کاری است که هوش مصنوعی انجام می‌دهد.» او نحوه سوق دادن برخی افراد به این فناوری برای انجام کارهای عجیبی که برای انجام آن‌ها طراحی نشده است را برجسته می‌کند. او می‌گوید، هنرمندان اغلب این نوع ابزارها را تصاحب یا سوء استفاده می‌کنند.

برایان-کینز به کار ترنس براد، یکی دیگر از همکارانش در موسسه محاسبات خلاق، به عنوان یک نمونه مورد علاقه اشاره می‌کند. براد از تکنیک‌هایی مانند خم کردن شبکه استفاده می‌کند، که شامل وارد کردن لایه‌های جدید به یک شبکه عصبی برای تولید جلوه‌های بصری پر از نقص در تصاویر تولید شده است، و تولید تصاویر با مدلی که بدون داده آموزش دیده است، که تقریباً لکه‌های انتزاعی رنگی مانند Rothko تولید می‌کند.

اما براد یک مورد افراطی است. برایان-کینز آن را اینگونه خلاصه می‌کند: «مشکل این است که شما این شکاف را بین ابزارهای مولد بسیار تجاری دارید که خروجی‌های با کیفیت فوق‌العاده بالا تولید می‌کنند، اما کنترل بسیار کمی بر کاری که انجام می‌دهند دارید—و سپس این انتهای دیگر را دارید که کنترل کاملی بر کاری که انجام می‌دهند دارید، اما موانع استفاده بالا هستند زیرا شما باید کسی باشید که راحت است زیر کاپوت کامپیوتر خود برود.»

او می‌گوید: «این تعداد کمی از افراد است. "این تعداد بسیار کمی از هنرمندان است."»

خوشبختانه، ما در حال ورود به دوره‌ای هستیم که در آن افراد بیشتری قادر خواهند بود از این نوع سفارشی‌سازی‌ها لذت ببرند. OpenAI اخیراً توانایی ایجاد GPTهای سفارشی خود را راه‌اندازی کرد، که به کاربران—حتی کاربرانی که در توسعه نرم‌افزار متخصص نیستند—اجازه می‌دهد مدل‌های خود را برای اهداف خاص به روش‌های منحصر به فرد آموزش دهند. و مدل‌های متن به تصویر منبع باز در حال رواج هستند، به این معنی که هر کسی می‌تواند یک نسخه را دانلود کند و نحوه کار آن را تغییر دهد. شرکت‌هایی مانند شرکت استارت‌آپی Stability AI به تولید این مدل‌ها ادامه می‌دهند. یک ابزار مولد در نهایت چیزی نیست جز کد. به زودی افراد بیشتری می‌توانند وارد شوند و آن کد را تغییر دهند.

محققان در حال یافتن راه‌هایی برای هدایت کاربران با مهارت‌های فنی کم‌تر به سمت سفارشی‌سازی هستند. در سال 2022، گیاکاردی و همکارانش مطالعه‌ای را منتشر کردند که در آن مجموعه‌ای از مردم از ابزاری برای تغییر الگوهای بافت در مجموعه‌ای از تصاویر استفاده کردند. آن‌ها دریافتند که افراد از این ابزار برای راه‌هایی برای تغییر تصاویر استفاده می‌کنند که آن‌ها پیش‌بینی نکرده بودند. او می‌گوید: «آن‌ها روشی غیرمنتظره برای تفسیر تصویر داشتند. "به عنوان مثال، آن‌ها تصمیم گرفتند از آن برای برجسته کردن جزئیات خاصی در تصویر استفاده کنند."»

در سال 2023، او مطالعه مشابهی را منتشر کرد که در آن مجموعه‌ای از افراد از یک مدل مولد برای «بازمیکس» تصاویر از مجموعه موزه Rijksmuseum آمستردام به روش‌های منحصر به فرد استفاده کردند. او می‌گوید: «آنچه برای من جالب بود این بود که مردم تمایل داشتند تصاویر را به روشی بسیار خلاقانه به یکدیگر مرتبط کنند.»

محققان درک درستی از اینکه ابزارهای خلاقیت مشارکتی چگونه می‌توانند افراد را برای انجام کارهای هنری و طراحی تحت تأثیر قرار دهند، به دست می‌آورند. گام بعدی می‌تواند این باشد که ببینیم چگونه آن ابزارها می‌توانند افراد را در نحوه تفکر درباره چیزها تحت تأثیر قرار دهند.

برای ویلسون، سفر با دستیار کدنویسی زنده خود در حال حاضر او را تغییر داده است. او به یاد می‌آورد که زمانی یک معلم به او گفت که کارهای اولیه او، اگرچه جالب بودند، اما فقط «بوق و ترق و ترقه» بودند. عامل کدنویسی زنده به او کمک کرده است تا یک قطعه موسیقی معتبرتر بسازد. ویلسون می‌گوید: «به این دلیل نیست که قبلاً از نظر ذهنی قادر به آن نبودم.» «این فقط نوعی لرزه بین تفکر و عمل بود که در آن زمان برای من در دسترس نبود.»

به این ترتیب، آینده‌ای که ویلسون، کوک، آرزبرگر، گیاکاردی، برایان-کینز و همکارانشان در حال طراحی آن هستند، فراتر از این است که هوش مصنوعی چیزها را آسان‌تر کند یا افراد را به سمت انجام کارهایی که قبلاً نمی‌توانستند سوق دهد. این در مورد تبدیل هویت خلاقانه خود افراد است.