Издательство Merriam-Webster утверждает, что OpenAI без разрешения использовала около 100 000 статей, материалов энциклопедий и словарных статей для обучения ChatGPT.
Популярный англоязычный словарь Merriam-Webster подал в суд на OpenAI, обвинив компанию в использовании материалов, защищённых авторским правом, для обучения своей модели ChatGPT.
Иск, поданный совместно с его материнской компанией Encyclopaedia Britannica, утверждает, что OpenAI скопировала более 100 000 материалов, включая статьи, энциклопедические и словарные статьи из интернет-источников. В жалобе говорится, что этот контент использовался для того, чтобы обучить ChatGPT генерировать ответы на запросы пользователей без разрешения.
По утверждению истцов, OpenAI нарушает авторские права тремя способами: массово копируя защищённые материалы, используя этот контент для обучения своих ИИ-систем и генерируя ответы, напоминающие оригинальные тексты.
Ответы ChatGPT часто содержат «дословные или почти дословные воспроизведения» информации из материалов словаря, утверждается в иске. В результате пользователи, которые иначе зашли бы на сайт издателя, этого не делают.
«Продукты ответчиков на основе ChatGPT бесплатно пользуются заслуживающим доверия, высококачественным контентом истцов … оттягивая трафик с сайтов истцов с помощью сгенерированных ИИ пересказов их собственных материалов», — говорится в исковом заявлении.
По словам истцов, материалы словаря также используются в так называемых галлюцинациях ИИ — ответах, которые система выдумывает, когда ей не хватает информации, чтобы ответить на запрос пользователя.
Ответы ChatGPT также «вводя в заблуждение опускают» части словарного контента, из‑за чего его объяснения оказываются «неполными и неточными».
Истцы требуют денежной компенсации и судебного запрета, который навсегда пресёк бы, как они утверждают, подобную практику OpenAI.
Euronews Next направила запрос в OpenAI с просьбой прокомментировать иск, однако на момент публикации ответа не получила.