اتهام سوءاستفاده ادوبی از آثار نویسندگان در آموزش هوش مصنوعی

0 4 2 دقیقه مطالعه

همانند بسیاری از شرکت‌های فناوری دیگر، ادوبی طی چند سال گذشته به شدت بر روی هوش مصنوعی تمرکز کرده است. این شرکت نرم‌افزاری از سال ۱۴۰۲، مجموعه‌ای از سرویس‌های مبتنی بر هوش مصنوعی را معرفی کرده، از جمله فایرفلای – مجموعه تولید رسانه با فناوری هوش مصنوعی. با این حال، اکنون پذیرش گسترده این فناوری ممکن است برای شرکت دردسرساز شده باشد، چرا که یک شکایت حقوقی جدید ادعا می‌کند برای آموزش یکی از مدل‌های هوش مصنوعی خود از کتاب‌های دزدی شده استفاده کرده است.

یک دادخواست گروهی پیشنهادی که به نمایندگی از الیزابت لیون، یک نویسنده اهل اورگن تنظیم شده، مدعی است که ادوبی نسخه‌های غیرقانونی بسیاری از کتاب‌ها را، از جمله آثار خودش، برای آموزش برنامه SlimLM این شرکت به کار برده است.

ادوبی SlimLM را به عنوان مجموعه‌ای از مدل‌های زبان کوچک توصیف می‌کند که می‌توانند «برای انجام وظایف کمکی مرتبط با اسناد در دستگاه‌های موبایل بهینه شوند.» ادوبی گفته که SlimLM با مجموعه داده SlimPajama-627B که مجموعه‌ای پرحجم، بدون داده تکراری و متن‌باز است و توسط شرکت Cerebras در خرداد ۱۴۰۲ منتشر شده، از قبل آموزش دیده است. لیون که تعدادی کتاب راهنما برای نویسندگی غیرداستانی نوشته، عنوان می‌کند که برخی از آثارش در داده‌های پیش‌آموزشی مورد استفاده ادوبی قرار داشته‌اند.

در دادخواست لیون که توسط یک منبع گزارش شده، آمده است که نوشته‌های او بخشی از زیرمجموعه پردازش‌شده یک مجموعه داده دستکاری‌شده بوده که پایه برنامه ادوبی است: «مجموعه داده SlimPajama با کپی و دستکاری مجموعه داده RedPajama (از جمله کپی کردن Books3) ایجاد شده است.» در ادامه این شکایت آمده: «از آنجا که SlimPajama نسخه مشتق‌شده‌ای از RedPajama است، این مجموعه، مجموعه داده Books3 را نیز دربر می‌گیرد که شامل آثار دارای حق نشر شاکی و اعضای گروه دادخواهی است.»

Books3، یک مجموعه عظیم متشکل از ۱۹۱ هزار کتاب که برای آموزش سیستم‌های هوش مصنوعی مولد به کار رفته، مدت‌هاست منبع مشکلات حقوقی برای جامعه فناوری بوده است. RedPajama نیز پای ثابت شماری از پرونده‌های قضایی بوده است. در شهریور ۱۴۰۲، دادخواستی علیه اپل مطرح شد که مدعی بود شرکت از آثار دارای حق نشر برای آموزش مدل هوش مصنوعی Apple Intelligence استفاده کرده است. در این پیگیری قانونی، به این مجموعه داده اشاره شده و شرکت فناوری به کپی آثار محافظت‌شده بدون رضایت، بدون ذکر منبع یا پرداخت هزینه متهم گردید. در مهر ۱۴۰۲، دادخواست مشابهی علیه Salesforce نیز ادعا کرد که این شرکت برای آموزش مدل‌هایش از RedPajama استفاده کرده است.

متاسفانه برای صنعت فناوری، چنین دعاوی حقوقی حالا به امری نسبتاً رایج تبدیل شده‌اند. الگوریتم‌های هوش مصنوعی با داده‌های گسترده‌ای آموزش می‌بینند که گاهی ادعا می‌شود شامل محتوای غیرمجاز بوده‌اند. در شهریور ۱۴۰۲، شرکت Anthropic موافقت کرد مبلغ ۱.۵ میلیارد دلار به شماری از نویسندگانی که از این شرکت بابت استفاده از نسخه‌های دزدی آثارشان در آموزش چت‌بات Claude شکایت کرده بودند، بپردازد. این پرونده به عنوان نقطه عطفی در مناقشات حقوقی مربوط به آثار دارای حق نشر در داده‌های آموزش هوش مصنوعی تلقی شد؛ مسأله‌ای که پرونده‌های متعدد مشابهی دارد.

Post Views: 34