Суд США: обучение ИИ на книгах — fair use

Федеральный судья Уильям Алсуп из Северного округа Калифорнии признал, что использование художественных и научно-популярных книг для обучения больших языковых моделей является «чрезвычайно трансформативным» и, следовательно, подпадает под доктрину «fair use». По словам Алсупа, «как любой читатель, стремящийся стать писателем, LLM Anthropic учились на произведениях не затем, чтобы их копировать или вытеснять, а чтобы резко свернуть и создать нечто иное».
Суд США: обучение ИИ на книгах — fair use
Изображение носит иллюстративный характер

Иск против Anthropic PBC подали бестселлер-авторы Андреа Бартц («We Were Never Here», «The Last Ferry Out»), Чарльз Гребер («The Good Nurse: A True Story of Medicine, Madness and Murder») и Кирк Уоллес Джонсон («The Feather Thief»). Истцы утверждают, что компания «украла» их книги для обучения чат-бота Claude, превратив это в многомиллиардный бизнес при поддержке Inc. и Alphabet Inc.

Алсуп отметил, что писатели не предъявили доказательств того, что Claude выдаёт «нарушающие авторское право копии». Если бы такие факты были, заявил судья, «это было бы совсем другое дело». Поэтому защита Anthropic на основе «fair use» остаётся в силе, однако сам процесс не закрыт.

Открытым остаётся вопрос о том, как именно в датасете оказались более семи миллионов «пиратских» книг, которые судья назвал «центральной библиотекой всех книг мира». За каждое произведение может быть начислено до 150 000 долларов статутных убытков, поэтому совокупная ответственность потенциально колоссальна.

Показательное значение решения подчёркивается тем, что это одно из первых судебных заключений, где прямо рассматривается допустимость обучения LLM на защищённых авторским правом текстах. В том же месяце Disney и Universal подали иск к Midjourney, обвинив генератор изображений в пиратстве, а ряд ИИ-компаний уже начал заключать лицензионные соглашения с издателями, предпочитая переговорам суды.

Anthropic заявила, что «довольна» признанием трансформативности обучения, но «не согласна» с необходимостью разбирательства относительно источника и хранения книг и «оценивает варианты», оставаясь «уверенной» в своей позиции. Представитель истцов комментарии пока не дал.

Дальнейший процесс сосредоточится на фактах получения и хранения копий. При неблагоприятном исходе компания рискует статутными убытками за каждое издание, несмотря на уже подтверждённый статус «fair use» в части самого обучающего процесса.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка