قاضی: متا باید از ادعای حذف اطلاعات حق تکثیر از خوراک آموزشی لاما دفاع کند

غول فیسبوک متهم است که نمی‌خواست شبکه‌های عصبی نتایجی را منتشر کنند که باعث فاش شدن اطلاعات شود

یک قاضی حکم داده است که متا باید به ادعایی پاسخ دهد مبنی بر اینکه اطلاعات مدیریت حق تکثیر به اصطلاح را از مطالب مورد استفاده برای آموزش مدل‌های هوش مصنوعی خود حذف کرده است.

حکم روز جمعه توسط قاضی وینس چهابریا مربوط به پرونده Kadrey et al در برابر Meta Platforms بود که در ژوئیه سال ۲۰۲۳ در دادگاه فدرال سانفرانسیسکو به عنوان یک اقدام طبقاتی پیشنهادی توسط نویسندگان ریچارد کادری، سارا سیلورمن و کریستوفر گلدن تشکیل شد، که معتقدند استفاده تایتان اینستاگرام از آثارشان برای آموزش شبکه‌های عصبی آنها غیرقانونی است.

پرونده آنها تا ژانویه ۲۰۲۵ ادامه داشت، زمانی که شاکیان این ادعای مهم را مطرح کردند که متا می‌دانست از مطالب دارای حق تکثیر برای آموزش استفاده می‌کند، و بنابراین مدل‌های هوش مصنوعی آن نتایجی را تولید می‌کنند که شامل اطلاعات مدیریت حق تکثیر (CMI) – اصطلاح فانتزی برای مواردی مانند خالق یک اثر دارای حق تکثیر، مجوز و شرایط استفاده آن، تاریخ ایجاد آن و غیره که همراه با مواد دارای حق تکثیر هستند، می‌شود.

نویسندگان خشمگین ادعا کردند که متا تمام این اطلاعات حق تکثیر را از آثاری که برای آموزش مدل‌های خود استفاده می‌کرد حذف کرده است تا کاربران متوجه نشوند نتایجی که می‌بینند از مطالب دارای حق تکثیر ناشی می‌شود.

قاضی چهابریا هفته گذشته به ادعای شاکی مبنی بر اینکه متا با حذف اطلاعیه‌های حق تکثیر از آثار مورد استفاده برای آموزش خانواده مدل‌های Llama غول فیسبوک، قانون حق تکثیر دیجیتال هزاره (DMCA) ایالات متحده را نقض کرده است، اجازه ادامه داد. این تصمیم احتمال بیشتری می‌دهد که این پرونده به توافق یا محاکمه ختم شود.

"ادعاهای [شاکیان] یک 'استنباط معقول، اگرچه نه چندان قوی' را مطرح می‌کند که متا CMI را حذف کرده است تا سعی کند از خروجی CMI توسط Llama و در نتیجه افشای اینکه بر روی مطالب دارای حق تکثیر آموزش داده شده است، جلوگیری کند." قاضی چهابریا در دستور خود [PDF] نوشت. "این استفاده از مطالب دارای حق تکثیر به وضوح یک نقض (ادعایی) قابل شناسایی است."

متا قبلاً اعتراف کرده است [PDF] که از مجموعه داده‌ای به نام Books3 برای آموزش مدل زبانی بزرگ Llama 1 خود استفاده کرده است. این مجموعه داده یافت شده است که شامل آثار دارای حق تکثیر است.

خبر برای متا چندان بد نیست زیرا قاضی چهابریا یکی از ادعاهای شاکیان را رد کرد – اینکه استفاده متا از کتاب‌های بدون مجوز به دست آمده از تورنت‌های همتا به همتا، قانون جامع دسترسی و کلاهبرداری داده‌های رایانه‌ای کالیفرنیا (CDAFA) را نقض می‌کند.

ادوارد لی، استاد حقوق در دانشگاه سانتا کلارا، به The Register گفت که ما نباید هیچ چیز در مورد استفاده منصفانه بر اساس ادعای DMCA 1202(b)(1) نویسنده درباره CMI پاک شده استنباط کنیم.

"در جلسه استماع، قاضی چهابریا همچنین نسبت به اثبات ادعای DMCA توسط شاکیان ابراز تردید کرد و گفت که می‌تواند در حکم خلاصه دوباره مورد بررسی قرار گیرد." لی گفت. "آنچه نشان می‌دهد این است که وکلای شاکیان توانستند یک مبنای واقعی خاص‌تر برای ادعای DMCA خود پیدا کنند، که قبلاً در این پرونده رد شده بود."

با اجازه دادن به پیشرفت ادعای CMI، چهابریا دومین حکمی را صادر کرده است که نشان می‌دهد بلعیدن بی‌رویه مطالب دارای حق تکثیر برای آموزش مدل‌های هوش مصنوعی ممکن است عواقب مالی داشته باشد.

اولین بار ماه گذشته بود که تامسون رویترز یک حکم خلاصه جزئی علیه شرکت هوش مصنوعی تعطیل شده راس اینتلیجنس به دست آورد که از فرار شرکت متهم از مسئولیت با ادعای استفاده منصفانه جلوگیری می‌کند.

محققان حقوقی استدلال کرده‌اند که استنتاج هوش مصنوعی – برنامه‌هایی که بر اساس مدل‌های هوش مصنوعی خروجی تولید می‌کنند – به احتمال زیاد نقض حق تکثیر محسوب می‌شود زیرا وقتی یک مدل کلمه به کلمه اثر نویسنده را بیرون می‌دهد، آشکار است. وارد کردن مطالب دارای حق تکثیر به مدل‌ها برای آموزش به عنوان احتمال بیشتری برای واجد شرایط بودن برای دفاعیات استفاده منصفانه تلقی شده است.

با این حال، تصمیم تامسون رویترز و بقای ادعای DMCA علیه متا به نظر می‌رسد که احتمالاً موقعیت شاکیان را در سایر دعوای‌های مربوط به هوش مصنوعی تقویت می‌کند.

به عنوان مثال، Tremblay et al در برابر OpenAI et al هفته گذشته اصلاح شد [PDF]. این پرونده به دنبال احیای ادعای DMCA رد شده قبلی خود بر اساس شواهد جدید اما ویرایش شده است که از ادعاهای حذف CMI پشتیبانی می‌کند.

شکایت اصلاح شده با استناد به افشاگری‌هایی که پس از کشف انجام شد، استدلال می‌کند: "ادعای DMCA به اندازه کافی ادعا می‌کند که OpenAI در واقع CMI را برای آموزش مدل‌های زبانی بزرگ خود حذف کرده است."

متا به درخواست برای اظهار نظر پاسخ نداد. ®