Как стало известно из недавно рассекреченных судебных документов, генеральный директор Meta Марк Цукерберг лично одобрил использование пиратских электронных книг и статей для обучения языковой модели Llama.
Группа известных авторов, включая Сару Сильверман и Та-Нехиси Коутса, подала иск против Meta, утверждая, что компания незаконно использовала их произведения для тренировки искусственного интеллекта.
По данным истцов, несмотря на озабоченность внутри команды разработчиков ИИ, Цукерберг дал разрешение на использование базы данных LibGen - агрегатора ссылок, предоставляющего доступ к защищенным авторским правом материалам крупных издательств. Ранее LibGen неоднократно подвергался судебным искам и штрафам за нарушение авторских прав.
В документах также утверждается, что Meta пыталась скрыть факт нарушения авторских прав. Инженер компании Николай Башлыков написал скрипт для удаления информации об авторских правах из электронных книг, включая слова "copyright" и "acknowledgments".
Кроме того, Meta использовала торренты для загрузки контента LibGen, что, по мнению истцов, является дополнительным нарушением авторских прав, поскольку при этом происходит одновременная раздача файлов другим пользователям.
В Meta утверждают, что их действия защищены доктриной добросовестного использования (fair use), которая разрешает использование защищенных авторским правом материалов для создания чего-то нового, если конечный результат достаточно трансформативен.
Судья Винс Чхабрия, ведущий это дело, отклонил запрос Meta на сокрытие большей части документов, отметив, что компания стремится избежать негативной огласки, а не защитить конфиденциальную бизнес-информацию.