اتهام سوءاستفاده ادوبی از آثار نویسندگان در آموزش هوش مصنوعی

“`html
همانند بسیاری از شرکتهای فناوری دیگر، ادوبی طی چند سال گذشته به شدت بر روی هوش مصنوعی تمرکز کرده است. این شرکت نرمافزاری از سال ۱۴۰۲، مجموعهای از سرویسهای مبتنی بر هوش مصنوعی را معرفی کرده، از جمله فایرفلای – مجموعه تولید رسانه با فناوری هوش مصنوعی. با این حال، اکنون پذیرش گسترده این فناوری ممکن است برای شرکت دردسرساز شده باشد، چرا که یک شکایت حقوقی جدید ادعا میکند برای آموزش یکی از مدلهای هوش مصنوعی خود از کتابهای دزدی شده استفاده کرده است.
یک دادخواست گروهی پیشنهادی که به نمایندگی از الیزابت لیون، یک نویسنده اهل اورگن تنظیم شده، مدعی است که ادوبی نسخههای غیرقانونی بسیاری از کتابها را، از جمله آثار خودش، برای آموزش برنامه SlimLM این شرکت به کار برده است.
ادوبی SlimLM را به عنوان مجموعهای از مدلهای زبان کوچک توصیف میکند که میتوانند «برای انجام وظایف کمکی مرتبط با اسناد در دستگاههای موبایل بهینه شوند.» ادوبی گفته که SlimLM با مجموعه داده SlimPajama-627B که مجموعهای پرحجم، بدون داده تکراری و متنباز است و توسط شرکت Cerebras در خرداد ۱۴۰۲ منتشر شده، از قبل آموزش دیده است. لیون که تعدادی کتاب راهنما برای نویسندگی غیرداستانی نوشته، عنوان میکند که برخی از آثارش در دادههای پیشآموزشی مورد استفاده ادوبی قرار داشتهاند.
در دادخواست لیون که توسط یک منبع گزارش شده، آمده است که نوشتههای او بخشی از زیرمجموعه پردازششده یک مجموعه داده دستکاریشده بوده که پایه برنامه ادوبی است: «مجموعه داده SlimPajama با کپی و دستکاری مجموعه داده RedPajama (از جمله کپی کردن Books3) ایجاد شده است.» در ادامه این شکایت آمده: «از آنجا که SlimPajama نسخه مشتقشدهای از RedPajama است، این مجموعه، مجموعه داده Books3 را نیز دربر میگیرد که شامل آثار دارای حق نشر شاکی و اعضای گروه دادخواهی است.»
Books3، یک مجموعه عظیم متشکل از ۱۹۱ هزار کتاب که برای آموزش سیستمهای هوش مصنوعی مولد به کار رفته، مدتهاست منبع مشکلات حقوقی برای جامعه فناوری بوده است. RedPajama نیز پای ثابت شماری از پروندههای قضایی بوده است. در شهریور ۱۴۰۲، دادخواستی علیه اپل مطرح شد که مدعی بود شرکت از آثار دارای حق نشر برای آموزش مدل هوش مصنوعی Apple Intelligence استفاده کرده است. در این پیگیری قانونی، به این مجموعه داده اشاره شده و شرکت فناوری به کپی آثار محافظتشده بدون رضایت، بدون ذکر منبع یا پرداخت هزینه متهم گردید. در مهر ۱۴۰۲، دادخواست مشابهی علیه Salesforce نیز ادعا کرد که این شرکت برای آموزش مدلهایش از RedPajama استفاده کرده است.
متاسفانه برای صنعت فناوری، چنین دعاوی حقوقی حالا به امری نسبتاً رایج تبدیل شدهاند. الگوریتمهای هوش مصنوعی با دادههای گستردهای آموزش میبینند که گاهی ادعا میشود شامل محتوای غیرمجاز بودهاند. در شهریور ۱۴۰۲، شرکت Anthropic موافقت کرد مبلغ ۱.۵ میلیارد دلار به شماری از نویسندگانی که از این شرکت بابت استفاده از نسخههای دزدی آثارشان در آموزش چتبات Claude شکایت کرده بودند، بپردازد. این پرونده به عنوان نقطه عطفی در مناقشات حقوقی مربوط به آثار دارای حق نشر در دادههای آموزش هوش مصنوعی تلقی شد؛ مسألهای که پروندههای متعدد مشابهی دارد.
“`



