شاتراستاک
شاتراستاک

من نسبت به هوش مصنوعی موسیقی شک داشتم – تا اینکه واقعاً از آن استفاده کردم

با برنامه‌های هوش مصنوعی (AI) که اکنون می‌توانند کل آهنگ‌ها را بر اساس تقاضا تولید کنند، اگر فکر کنید هوش مصنوعی ممکن است در نهایت منجر به زوال موسیقی ساخته شده توسط انسان شود، قابل بخشش هستید.

اما هنوز هم می‌توان از هوش مصنوعی به طور اخلاقی برای کمک به نوازندگان انسانی برای به چالش کشیدن خود و توسعه توانایی‌های موسیقی‌سازی خود استفاده کرد. من باید بدانم. من به عنوان یک آهنگساز و مدرس موسیقی، تا زمانی که شروع به کار با فناوری نکردم، نسبت به هوش مصنوعی شک داشتم.

دو طرف بحث

اگر می‌توانید یک دستور متنی بنویسید، می‌توانید از هوش مصنوعی برای ایجاد یک قطعه در هر ژانری، برای تقریباً هر کاربرد موسیقی استفاده کنید.

علاوه بر تولید قطعات کامل، از هوش مصنوعی موسیقی می‌توان در تجزیه و تحلیل صدا، حذف نویز، میکس و مسترینگ و ایجاد پالت‌های صوتی کامل (مانند استفاده در بازی‌های ویدیویی و پادکست‌ها) استفاده کرد. Suno، Beatoven، AIVA، Soundraw و Udio از جمله شرکت‌هایی هستند که در حال حاضر در فضای هوش مصنوعی موسیقی پیشرو هستند.

در بسیاری از موارد، خروجی‌ها لازم نیست عالی باشند، فقط باید به اندازه کافی خوب باشند و می‌توانند خدمات نوازندگان و طراحان صدای واقعی را تضعیف کنند.

صنعت موسیقی به طور قابل درکی نگران است. در آوریل ۲۰۲۴، اتحاد حقوق هنرمندان مستقر در ایالات متحده، یک نامه سرگشاده منتشر کرد که توسط بیش از ۲۰۰ هنرمند امضا شده بود و از توسعه‌دهندگان می‌خواست آموزش هوش مصنوعی خود را با آثار دارای حق چاپ متوقف کنند (زیرا این امر به شرکت‌ها اجازه می‌دهد تا موسیقی و تصویر هنرمندان را تقلید کنند و بنابراین حق امتیاز پرداختی به هنرمندان را کاهش دهند).

در عین حال، شرکت‌های هوش مصنوعی موسیقی ادعا می‌کنند که مانع ساخت موسیقی را کاهش می‌دهند، به عنوان مثال با از بین بردن نیاز به تجهیزات فیزیکی و آموزش موسیقی سنتی.

در یک مصاحبه از ژانویه، مدیر عامل Suno، مایکی شولمن گفت:

در حال حاضر ساخت موسیقی واقعاً لذت‌بخش نیست. زمان زیادی می‌برد. تمرین زیادی می‌خواهد […] اکثر مردم از اکثر زمانی که صرف ساخت موسیقی می‌کنند، لذت نمی‌برند.

این دور از پیامی است که می‌خواهم به دانش‌آموزانم بفرستم. با این حال، متأسفانه فشاری را که نوازندگان برای تسلط بر هنر خود در اسرع وقت احساس می‌کنند، در دنیایی که به طور فزاینده‌ای سریع است و به سمت یک هدف نهایی ناملموس هدایت می‌شود، به جای لذت بردن از روند اشتباه کردن و یادگیری، منعکس می‌کند.

از یک شکاک به یک مدافع مردد

در سال ۲۰۲۳، خانه اپرای سیدنی از من خواست تا اثر جدیدی را با شرکت طراحی مستقر در سیدنی، Kopi Su، ایجاد کنم و در این فرآیند یک ابزار جدید هوش مصنوعی موسیقی مولد را توسعه دهم. این ابزار که Koup Music نام دارد، اکنون در مرحله آزمایش بتا است.

من این فرصت را پذیرفتم - اما با تردیدهای بسیار، زیرا واقعاً علاقه‌ای به کار با هوش مصنوعی نداشتم. آیا این یک اتلاف وقت بزرگ خواهد بود، یا اینکه داده‌های من به یک مجموعه داده هوش مصنوعی مرموز اضافه می‌شود؟ یا اینکه مسیرهای خلاقانه جدیدی را برای من باز می‌کند؟

این ابزار بر اساس یک مدل انتشار متن به تصویر به نام Riffusion ساخته شده بود. یک اعلان متنی را می‌گیرد و یک طیف‌نگار (spectrogram) تولید می‌کند، که یک نمایش بصری از فرکانس‌های مختلف در یک سیگنال صوتی است که با گذشت زمان تغییر می‌کنند. سپس این به صدا تبدیل می‌شود.

ابتدا، من نمونه ضبط شده خودم را در هوش مصنوعی آپلود می‌کردم و سپس یک اعلان متنی را برای تبدیل آن به یک نمونه پنج ثانیه‌ای جدید انتخاب می‌کردم.

به عنوان مثال، می‌توانستم یک ملودی آوازی کوتاه را آپلود کنم و از هوش مصنوعی بخواهم آن را به یک حشره تبدیل کند، یا آن را برای یک سبک "هیپ هاپ" بازسازی کند. گاهی اوقات نمونه‌های تولید شده بسیار شبیه صدای من بودند (به دلیل آوازهایی که آپلود کردم).

خروجی صدای حشره زیر، موضوع قطعه موسیقی زیر شد.

مرورگر شما از عنصر صوتی پشتیبانی نمی‌کند.

در زمان پروژه، خروجی‌ها فقط می‌توانستند ۵ یا ۱۰ ثانیه طول داشته باشند - که برای ساخت یک قطعه کامل کافی نبود. من این را مثبت تلقی کردم، زیرا به این معنی بود که مجبور بودم نمونه‌ها را در اثر بزرگتر خودم بگنجانم.

برخی از نمونه‌ها جذاب بودند. برخی خنده‌دار بودند. بقیه خسته‌کننده بودند. برخی با رنگ‌های خش‌دار و خشن بیرون آمدند. نقص همه اینها به من اجازه داد که لذت ببرم.

من بر تولید عناصر موسیقی جداگانه با درخواست‌های متنی خود تمرکز کردم، نه نمونه‌های کاملاً تنظیم شده. یک ضرب درام یا خط ملودی تولید شده می‌توانست برای الهام بخشیدن به یک قطعه موسیقی کاملاً جدید در سبکی که هرگز امتحان نمی‌کردم، کافی باشد.

مرورگر شما از عنصر صوتی پشتیبانی نمی‌کند.

گاهی اوقات، یک نمونه تولید شده کافی بود. در مواقع دیگر، من خودم را به چالش می‌کشیدم تا فقط از صداهای تولید شده توسط هوش مصنوعی برای ایجاد یک قطعه کامل استفاده کنم. در این موارد، از تکنیک‌هایی مانند فیلتر کردن و حلقه کردن قطعات کوچک برای بیرون کشیدن صداهایی که می‌خواستم استفاده می‌کردم.

به عنوان مثال، من از نمونه‌های صوتی زیر برای ایجاد قطعه زیر استفاده کردم:

مرورگر شما از عنصر صوتی پشتیبانی نمی‌کند.

این فرآیند مانند یک همکاری بود - مثل اینکه من با یک همکار عجیب و غریب موسیقی می‌سازم. این فشار را برای ساخت موسیقی "بی‌نقص" از بین برد و در عوض به من اجازه داد تا بر امکانات خلاقانه جدید تمرکز کنم.

برداشت‌های من

من به این نتیجه رسیده‌ام که بد نیست بدانیم هوش مصنوعی‌های بزرگ موسیقی چه توانایی‌هایی دارند. ما می‌توانیم از آنها برای پیشبرد درک موسیقی خود استفاده کنیم، به عنوان مثال با مطالعه نحوه استفاده آنها از روندهای سبکی و تکنیک‌های میکس، یا نحوه ترجمه ایده‌های موسیقی برای پیشنهاد ژانرهای مختلف.

برای من، کلید از بین بردن شک و تردید من نسبت به هوش مصنوعی، استفاده از هوش مصنوعی بود که کل فرآیند کار را در دست نمی‌گرفت. من نسبت به پیشنهادات آن منعطف باقی ماندم، در حالی که از دانش خود برای حفظ کنترل خلاقانه استفاده می‌کردم.

مطالعات متعدد نشان داده‌اند که کاربران هوش مصنوعی موسیقی گزارش داده‌اند که از برنامه‌هایی که به آنها اجازه می‌دهد حس مالکیت بر فرآیند آهنگسازی را حفظ کنند، راضی هستند.

عامل ارتباطی در بین این پروژه‌ها این بود که هوش مصنوعی کل آثار موسیقی را به یکباره تولید نمی‌کرد. در عوض، مقدار محدودی از اطلاعات موسیقی (مانند ریتم‌ها، ملودی‌ها یا آکوردها) تولید می‌شد که به کاربر اجازه می‌داد نتیجه نهایی را تعیین کند.

زیبایی در نقص انسانی

با وجود ادعاهای شولمن، کلید یک رابطه معنادار با هوش مصنوعی موسیقی، کار کردن در کنار آن است - نه اینکه اجازه دهید تمام کارها را انجام دهد.

آیا فکر می‌کنم هر دانش‌آموز موسیقی باید شروع به گنجاندن هوش مصنوعی در تمرین روزانه خود کند؟ نه. اما در شرایط مناسب، می‌تواند ابزارهایی را برای تولید چیزی واقعاً خلاقانه فراهم کند.

ساخت هنر "ناقص" که زمان می‌برد - و سخت‌کوشی - بهای انسان بودن است. و من از این بابت سپاسگزارم.