گاهی اوقات میم‌ها آنقدر خنده‌دار هستند که گوشی از دستتان روی صورتتان می‌افتد. اعتبار: jeffbergen از طریق Getty Images
گاهی اوقات میم‌ها آنقدر خنده‌دار هستند که گوشی از دستتان روی صورتتان می‌افتد. اعتبار: jeffbergen از طریق Getty Images

مطالعه نشان می‌دهد که شرح‌های تولید شده توسط هوش مصنوعی برای میم‌ها به طور متوسط خنده‌دارتر از انسان‌ها هستند

مولیک اعلام کرد "آزمون تورینگ میم با موفقیت پشت سر گذاشته شد"، اما یک مطالعه جدید یک شرط مهم را ارائه می‌دهد.

یک مطالعه جدید که به بررسی ایجاد میم می‌پردازد، نشان داد که شرح‌های تولید شده توسط هوش مصنوعی برای میم‌ها در تصاویر میم معروف موجود، به طور متوسط امتیاز بالاتری در طنز، خلاقیت و "قابلیت اشتراک‌گذاری" نسبت به شرح‌های ساخته شده توسط افراد کسب کرده‌اند. با این وجود، افراد هنوز هم استثنایی‌ترین نمونه‌های فردی را ایجاد کردند.

این تحقیق که در کنفرانس بین‌المللی رابط‌های کاربری هوشمند ۲۰۲۵ ارائه خواهد شد، تصویری دقیق از چگونگی عملکرد متفاوت هوش مصنوعی و انسان‌ها در وظایف ایجاد طنز را نشان می‌دهد. نتایج به حدی تعجب‌آور بود که یک متخصص پیروزی را برای ماشین‌ها اعلام کرد.

پروفسور وارتون، اتان مولیک پس از بررسی نتایج مطالعه در Bluesky نوشت: "متاسفم که اعلام کنم آزمون تورینگ میم با موفقیت پشت سر گذاشته شد." مولیک به طور آکادمیک به مطالعه هوش مصنوعی می‌پردازد و او به یک آزمون معروف اشاره می‌کند که توسط پیشگام محاسبات، آلن تورینگ در سال 1950 پیشنهاد شد که به دنبال تعیین این است که آیا انسان‌ها می‌توانند بین خروجی‌های هوش مصنوعی و محتوای ایجاد شده توسط انسان تمایز قائل شوند یا خیر.

اما شاید برای تاج‌گذاری ربات‌ها خیلی زود باشد. همانطور که در مقاله آمده است، "در حالی که هوش مصنوعی می‌تواند بهره‌وری را افزایش دهد و محتوایی ایجاد کند که برای مخاطبان گسترده جذاب باشد، خلاقیت انسانی برای محتوایی که در سطح عمیق‌تری ارتباط برقرار می‌کند، بسیار مهم است."

تیم تحقیقاتی بین‌المللی از موسسه سلطنتی فناوری KTH در سوئد، LMU مونیخ در آلمان و TU دارمشتات در آلمان، سه سناریو آزمایش را برای مقایسه کیفیت ایجاد میم ایجاد کردند. آنها انسان‌هایی را که به تنهایی کار می‌کردند در مقابل انسان‌هایی که با مدل‌های زبانی بزرگ (LLM) همکاری می‌کردند، به ویژه GPT-4o OpenAI، و میم‌هایی که به طور کامل توسط GPT-4o بدون ورودی انسانی تولید می‌شدند، قرار دادند.

برخی از الگوهای تصویر میم مورد استفاده در مطالعه، برگرفته از مقاله.
برخی از الگوهای تصویر میم مورد استفاده در مطالعه، برگرفته از مقاله. اعتبار: Wu et al.
Wu et al.

محققان شرح‌های میم را در سه دسته مرتبط (کار، غذا و ورزش) آزمایش کردند تا بررسی کنند که هوش مصنوعی و انسان‌ها چگونه از پس طنز در زمینه‌های آشنا برمی‌آیند. آنها تفاوت‌های قابل توجهی در عملکرد در این دسته‌ها یافتند - به عنوان مثال، میم‌های مربوط به کار تمایل داشتند از نظر طنز و قابلیت اشتراک‌گذاری امتیاز بالاتری نسبت به میم‌های مربوط به غذا یا ورزش کسب کنند - که نشان می‌دهد چگونه زمینه می‌تواند بر اثربخشی طنز میم، چه ایجاد شده توسط انسان یا هوش مصنوعی، تأثیر بگذارد.

شایان ذکر است که مدل‌های هوش مصنوعی تصاویری را که در این مطالعه استفاده شده است، تولید نکرده‌اند. در عوض، محققان از الگوهای میم محبوب و از پیش موجود استفاده کردند و GPT-4o یا شرکت‌کنندگان انسانی برای آنها شرح تولید کردند.

میم‌های بیشتر، نه میم‌های بهتر

هنگامی که شرکت‌کنندگان جمع‌سپاری شده میم‌ها را رتبه‌بندی کردند، میم‌هایی که به طور کامل توسط مدل‌های هوش مصنوعی ایجاد شده بودند، به طور متوسط امتیاز بالاتری در طنز، خلاقیت و قابلیت اشتراک‌گذاری کسب کردند. محققان قابلیت اشتراک‌گذاری را به عنوان پتانسیل یک میم برای گردش گسترده تعریف کردند که تحت تأثیر طنز، ارتباط و ارتباط با موضوعات فرهنگی فعلی قرار دارد. آنها خاطرنشان می‌کنند که این مطالعه از جمله اولین مطالعاتی است که نشان می‌دهد میم‌های تولید شده توسط هوش مصنوعی از میم‌های ایجاد شده توسط انسان در این معیارها بهتر عمل می‌کنند.

با این حال، این مطالعه با یک شرط مهم همراه است. به طور متوسط، میم‌های کاملاً تولید شده توسط هوش مصنوعی امتیاز بالاتری نسبت به میم‌های ایجاد شده توسط انسان به تنهایی یا انسان‌هایی که با هوش مصنوعی همکاری می‌کنند، کسب کردند. اما هنگامی که محققان به بهترین میم‌های فردی نگاه کردند، انسان‌ها خنده‌دارترین نمونه‌ها را ایجاد کردند و همکاری‌های انسان و هوش مصنوعی خلاقانه‌ترین و قابل اشتراک‌گذاری‌ترین میم‌ها را تولید کردند. به عبارت دیگر، مدل‌های هوش مصنوعی به طور مداوم میم‌هایی با جذابیت گسترده تولید می‌کردند، اما انسان‌ها - با یا بدون کمک هوش مصنوعی - هنوز هم استثنایی‌ترین نمونه‌های فردی را می‌ساختند.

نمودارهایی از گردش کار ایجاد و ارزیابی میم‌ها برگرفته از مقاله.
نمودارهایی از گردش کار ایجاد و ارزیابی میم‌ها برگرفته از مقاله. اعتبار: Wu et al.
Wu et al.

این مطالعه همچنین نشان داد که شرکت‌کنندگانی که از کمک هوش مصنوعی استفاده می‌کنند، ایده‌های میم بسیار بیشتری تولید می‌کنند و این فرآیند را آسان‌تر و کم تلاش‌تر توصیف می‌کنند. علیرغم این افزایش بهره‌وری، میم‌های مشترک انسان و هوش مصنوعی به طور متوسط امتیاز بالاتری نسبت به میم‌هایی که انسان‌ها به تنهایی ایجاد می‌کنند، کسب نکردند. همانطور که محققان بیان کردند، "افزایش بهره‌وری تیم‌های انسان و هوش مصنوعی منجر به نتایج بهتری نمی‌شود - فقط به نتایج بیشتر منجر می‌شود."

شرکت‌کنندگانی که از کمک هوش مصنوعی استفاده کردند، در مقایسه با سازندگان انفرادی، احساس مالکیت کمتری نسبت به ساخته‌های خود گزارش کردند. با توجه به اینکه حس مالکیت بر انگیزه و رضایت خلاقانه در این مطالعه تأثیر می‌گذارد، محققان پیشنهاد می‌کنند که افرادی که علاقه‌مند به استفاده از هوش مصنوعی هستند، باید به دقت در نظر بگیرند که چگونه کمک هوش مصنوعی را در وظایف خلاقانه متعادل کنند.

از مقاله: "4 میم برتر تولید شده توسط هوش مصنوعی، انسان‌ها و همکاری انسان و هوش مصنوعی در معیارهای طنز، خلاقیت و قابلیت اشتراک‌گذاری."
از مقاله: "4 میم برتر تولید شده توسط هوش مصنوعی، انسان‌ها و همکاری انسان و هوش مصنوعی در معیارهای طنز، خلاقیت و قابلیت اشتراک‌گذاری." اعتبار: Wu et al.
Wu et al.

بنابراین، چگونه یک مدل هوش مصنوعی می‌تواند چیزهای خنده‌داری بسازد که انسان‌ها از آن قدردانی می‌کنند؟ محققان عملکرد قوی متوسط مدل هوش مصنوعی را به آموزش آن بر روی مقادیر زیادی از داده‌های اینترنتی نسبت می‌دهند، که به آن اجازه می‌دهد الگوهای طنز با جذابیت گسترده را شناسایی کند. در همین حال، میم‌های ایجاد شده توسط انسان اغلب منعکس کننده تجربیات شخصی بیشتری بودند که گاهی اوقات محتوای بسیار خنده‌داری تولید می‌کردند اما به نوعی منجر به نمرات متوسط پایین‌تری می‌شدند.

محققان چند نمونه از شرح‌های میم از این مطالعه را که در تصاویر بالا دیده می‌شود، گنجانده‌اند. هنگامی که یک کاربر Bluesky اخیراً اشاره کرد که میم‌های تولید شده توسط هوش مصنوعی در این مطالعه "عالی نیستند"، مولیک اظهار داشت که یک مشاهده ممکن است تا حدی نتایج مطالعه را توضیح دهد: "یک درس این است که بسیاری از مردم میم‌های بد را خنده‌دار و جالب می‌دانند." نظر او یک سوال کلیدی در مورد یافته‌ها ایجاد می‌کند: آیا موفقیت هوش مصنوعی نشان دهنده مهارت آماری در بازتولید الگوهای طنز رایج است، یا صرفاً توانایی آن در هدف قرار دادن کمترین مخرج مشترک کمدی اینترنتی؟

محدودیت‌ها

این مطالعه چندین محدودیت قابل توجه داشت. جلسات ایجاد شرح میم نسبتاً کوتاه بود و شرکت‌کنندگان همیشه به طور کامل از قابلیت‌های مشترک ابزارهای هوش مصنوعی استفاده نمی‌کردند. تحقیقات آینده می‌تواند بررسی کند که آیا استفاده طولانی‌تر از ابزارهای هوش مصنوعی و درخواست‌های بهتر ممکن است همکاری‌های خلاقانه انسان و هوش مصنوعی را بیشتر افزایش دهد یا خیر.

علاوه بر این، استفاده از ارزیابان جمع‌سپاری شده، ذهنیت و تعصبات بالقوه نسبت به طنز جریان اصلی یا متعارف را وارد می‌کند، که احتمالاً میم‌های تولید شده توسط هوش مصنوعی را که برای جذابیت گسترده بهینه‌سازی شده‌اند، ترجیح می‌دهد. مطالعات آینده ممکن است به طور متناوب پانل‌های متخصص یا جمعیت‌های هدف را برای به تصویر کشیدن جنبه‌های ظریف و خاص فرهنگی طنز و خلاقیت، ترکیب کنند.

تیم تحقیقاتی پیشنهاد می‌کند که کارهای آینده باید سناریوهایی را بررسی کنند که در آن یک مدل هوش مصنوعی به سرعت ایده‌های متعددی تولید می‌کند و به انسان‌ها اجازه می‌دهد به عنوان متصدیانی عمل کنند که بهترین محتوا را انتخاب و اصلاح می‌کنند. اما در حال حاضر، انسان‌ها قهرمان شرح‌های میم باقی می‌مانند.

درباره نویسنده

بنج ادواردز گزارشگر ارشد هوش مصنوعی Ars Technica و بنیانگذار بخش اختصاصی هوش مصنوعی این سایت در سال 2022 است. او همچنین یک مورخ فناوری با تقریباً دو دهه تجربه است. در اوقات فراغت خود، موسیقی می‌نویسد و ضبط می‌کند، رایانه‌های قدیمی را جمع‌آوری می‌کند و از طبیعت لذت می‌برد. او در رالی، کارولینای شمالی زندگی می‌کند.