Ssylka

Суд США: обучение ИИ на книгах — fair use

Федеральный судья Уильям Алсуп из Северного округа Калифорнии признал, что использование художественных и научно-популярных книг для обучения больших языковых моделей является «чрезвычайно трансформативным» и, следовательно, подпадает под доктрину «fair use». По словам Алсупа, «как любой читатель, стремящийся стать писателем, LLM Anthropic учились на произведениях не затем, чтобы их копировать или вытеснять, а чтобы резко свернуть и создать нечто иное».
Суд США: обучение ИИ на книгах — fair use
Изображение носит иллюстративный характер

Иск против Anthropic PBC подали бестселлер-авторы Андреа Бартц («We Were Never Here», «The Last Ferry Out»), Чарльз Гребер («The Good Nurse: A True Story of Medicine, Madness and Murder») и Кирк Уоллес Джонсон («The Feather Thief»). Истцы утверждают, что компания «украла» их книги для обучения чат-бота Claude, превратив это в многомиллиардный бизнес при поддержке Inc. и Alphabet Inc.

Алсуп отметил, что писатели не предъявили доказательств того, что Claude выдаёт «нарушающие авторское право копии». Если бы такие факты были, заявил судья, «это было бы совсем другое дело». Поэтому защита Anthropic на основе «fair use» остаётся в силе, однако сам процесс не закрыт.

Открытым остаётся вопрос о том, как именно в датасете оказались более семи миллионов «пиратских» книг, которые судья назвал «центральной библиотекой всех книг мира». За каждое произведение может быть начислено до 150 000 долларов статутных убытков, поэтому совокупная ответственность потенциально колоссальна.

Показательное значение решения подчёркивается тем, что это одно из первых судебных заключений, где прямо рассматривается допустимость обучения LLM на защищённых авторским правом текстах. В том же месяце Disney и Universal подали иск к Midjourney, обвинив генератор изображений в пиратстве, а ряд ИИ-компаний уже начал заключать лицензионные соглашения с издателями, предпочитая переговорам суды.

Anthropic заявила, что «довольна» признанием трансформативности обучения, но «не согласна» с необходимостью разбирательства относительно источника и хранения книг и «оценивает варианты», оставаясь «уверенной» в своей позиции. Представитель истцов комментарии пока не дал.

Дальнейший процесс сосредоточится на фактах получения и хранения копий. При неблагоприятном исходе компания рискует статутными убытками за каждое издание, несмотря на уже подтверждённый статус «fair use» в части самого обучающего процесса.


Новое на сайте