Encyclopaedia Britannica подала в суд на OpenAI за использование материалов для обучения ИИ

В заявлении утверждается, что OpenAI использовала онлайн-статьи энциклопедии и словарные определения без разрешения для обучения своих языковых моделей, включая чат-бот ChatGPT. По оценке истцов, в процессе могли быть скопированы почти 100 000 материалов из базы Britannica.
Представители Britannica заявляют, что ответы, генерируемые ИИ, иногда воспроизводят их тексты почти дословно. По их словам, это снижает посещаемость сайта энциклопедии, поскольку пользователи получают краткие пересказы прямо в чат-боте, не переходя на оригинальный источник.
Кроме нарушения авторских прав, в иске упоминается и возможное нарушение товарных знаков. Компания утверждает, что система иногда создаёт ответы, где указывает Britannica в качестве источника информации без фактического разрешения, а также может генерировать ложные ссылки или цитаты.
В ответ представители OpenAI заявили, что модели обучаются на общедоступных данных из интернета и используют их в рамках принципа добросовестного использования (fair use). Компания считает, что такие технологии создают новые формы контента и способствуют инновациям.
Britannica требует компенсацию убытков и судебный запрет на дальнейшее использование её материалов в обучении ИИ. Этот процесс стал частью растущей серии судебных споров между правообладателями и разработчиками генеративного искусственного интеллекта, связанных с использованием защищённых материалов при обучении моделей.
Если дело будет рассмотрено по существу, его итог может стать одним из ключевых прецедентов для всей индустрии искусственного интеллекта и определить, какие данные компании могут использовать для обучения своих моделей.