غول فیسبوک متهم است که نمیخواست شبکههای عصبی نتایجی را منتشر کنند که باعث فاش شدن اطلاعات شود
یک قاضی حکم داده است که متا باید به ادعایی پاسخ دهد مبنی بر اینکه اطلاعات مدیریت حق تکثیر به اصطلاح را از مطالب مورد استفاده برای آموزش مدلهای هوش مصنوعی خود حذف کرده است.
حکم روز جمعه توسط قاضی وینس چهابریا مربوط به پرونده Kadrey et al در برابر Meta Platforms بود که در ژوئیه سال ۲۰۲۳ در دادگاه فدرال سانفرانسیسکو به عنوان یک اقدام طبقاتی پیشنهادی توسط نویسندگان ریچارد کادری، سارا سیلورمن و کریستوفر گلدن تشکیل شد، که معتقدند استفاده تایتان اینستاگرام از آثارشان برای آموزش شبکههای عصبی آنها غیرقانونی است.
پرونده آنها تا ژانویه ۲۰۲۵ ادامه داشت، زمانی که شاکیان این ادعای مهم را مطرح کردند که متا میدانست از مطالب دارای حق تکثیر برای آموزش استفاده میکند، و بنابراین مدلهای هوش مصنوعی آن نتایجی را تولید میکنند که شامل اطلاعات مدیریت حق تکثیر (CMI) – اصطلاح فانتزی برای مواردی مانند خالق یک اثر دارای حق تکثیر، مجوز و شرایط استفاده آن، تاریخ ایجاد آن و غیره که همراه با مواد دارای حق تکثیر هستند، میشود.
نویسندگان خشمگین ادعا کردند که متا تمام این اطلاعات حق تکثیر را از آثاری که برای آموزش مدلهای خود استفاده میکرد حذف کرده است تا کاربران متوجه نشوند نتایجی که میبینند از مطالب دارای حق تکثیر ناشی میشود.
قاضی چهابریا هفته گذشته به ادعای شاکی مبنی بر اینکه متا با حذف اطلاعیههای حق تکثیر از آثار مورد استفاده برای آموزش خانواده مدلهای Llama غول فیسبوک، قانون حق تکثیر دیجیتال هزاره (DMCA) ایالات متحده را نقض کرده است، اجازه ادامه داد. این تصمیم احتمال بیشتری میدهد که این پرونده به توافق یا محاکمه ختم شود.
"ادعاهای [شاکیان] یک 'استنباط معقول، اگرچه نه چندان قوی' را مطرح میکند که متا CMI را حذف کرده است تا سعی کند از خروجی CMI توسط Llama و در نتیجه افشای اینکه بر روی مطالب دارای حق تکثیر آموزش داده شده است، جلوگیری کند." قاضی چهابریا در دستور خود [PDF] نوشت. "این استفاده از مطالب دارای حق تکثیر به وضوح یک نقض (ادعایی) قابل شناسایی است."
متا قبلاً اعتراف کرده است [PDF] که از مجموعه دادهای به نام Books3 برای آموزش مدل زبانی بزرگ Llama 1 خود استفاده کرده است. این مجموعه داده یافت شده است که شامل آثار دارای حق تکثیر است.
- بنیاد نرمافزار آزاد برای دفاع از AGPLv3 در برابر افزونههای مجوز Neo4j وارد عمل میشود
- ما با معترضانی ملاقات میکنیم که میخواهند هوش مصنوعی عمومی را قبل از اینکه وجود داشته باشد ممنوع کنند
- یک پیروزی بالاخره: ضربه بزرگ به دنیای هوش مصنوعی در مناقشه حق تکثیر دادههای آموزشی
- سازندگان خواستار اعتراف و پرداخت هزینه تمام دادههای آموزشی هوش مصنوعی توسط غولهای فناوری هستند
خبر برای متا چندان بد نیست زیرا قاضی چهابریا یکی از ادعاهای شاکیان را رد کرد – اینکه استفاده متا از کتابهای بدون مجوز به دست آمده از تورنتهای همتا به همتا، قانون جامع دسترسی و کلاهبرداری دادههای رایانهای کالیفرنیا (CDAFA) را نقض میکند.
ادوارد لی، استاد حقوق در دانشگاه سانتا کلارا، به The Register گفت که ما نباید هیچ چیز در مورد استفاده منصفانه بر اساس ادعای DMCA 1202(b)(1) نویسنده درباره CMI پاک شده استنباط کنیم.
"در جلسه استماع، قاضی چهابریا همچنین نسبت به اثبات ادعای DMCA توسط شاکیان ابراز تردید کرد و گفت که میتواند در حکم خلاصه دوباره مورد بررسی قرار گیرد." لی گفت. "آنچه نشان میدهد این است که وکلای شاکیان توانستند یک مبنای واقعی خاصتر برای ادعای DMCA خود پیدا کنند، که قبلاً در این پرونده رد شده بود."
با اجازه دادن به پیشرفت ادعای CMI، چهابریا دومین حکمی را صادر کرده است که نشان میدهد بلعیدن بیرویه مطالب دارای حق تکثیر برای آموزش مدلهای هوش مصنوعی ممکن است عواقب مالی داشته باشد.
اولین بار ماه گذشته بود که تامسون رویترز یک حکم خلاصه جزئی علیه شرکت هوش مصنوعی تعطیل شده راس اینتلیجنس به دست آورد که از فرار شرکت متهم از مسئولیت با ادعای استفاده منصفانه جلوگیری میکند.
محققان حقوقی استدلال کردهاند که استنتاج هوش مصنوعی – برنامههایی که بر اساس مدلهای هوش مصنوعی خروجی تولید میکنند – به احتمال زیاد نقض حق تکثیر محسوب میشود زیرا وقتی یک مدل کلمه به کلمه اثر نویسنده را بیرون میدهد، آشکار است. وارد کردن مطالب دارای حق تکثیر به مدلها برای آموزش به عنوان احتمال بیشتری برای واجد شرایط بودن برای دفاعیات استفاده منصفانه تلقی شده است.
با این حال، تصمیم تامسون رویترز و بقای ادعای DMCA علیه متا به نظر میرسد که احتمالاً موقعیت شاکیان را در سایر دعوایهای مربوط به هوش مصنوعی تقویت میکند.
به عنوان مثال، Tremblay et al در برابر OpenAI et al هفته گذشته اصلاح شد [PDF]. این پرونده به دنبال احیای ادعای DMCA رد شده قبلی خود بر اساس شواهد جدید اما ویرایش شده است که از ادعاهای حذف CMI پشتیبانی میکند.
شکایت اصلاح شده با استناد به افشاگریهایی که پس از کشف انجام شد، استدلال میکند: "ادعای DMCA به اندازه کافی ادعا میکند که OpenAI در واقع CMI را برای آموزش مدلهای زبانی بزرگ خود حذف کرده است."
متا به درخواست برای اظهار نظر پاسخ نداد. ®