OpenAI занялась поиском легальных способов получения контента для обучения своих больших языковых моделей. Как заявило на днях руководство компании, её представители в настоящее время ведут переговоры «с десятками издателей» и активно обсуждают возможности договориться о лицензировании статей.
«Мы ведем переговоры и дискуссии с рядом издателей«, — сообщил в интервью Bloomberg News Том Рубин, директор по интеллектуальной собственности и контенту OpenAI, добавив, что переговоры проходят «конструктивно, в позитивной атмосфере и продвигаются хорошо».
Первые контракты уже подписаны
По информации Bloomberg, OpenAI недавно подписала многолетнее лицензионное соглашение на сумму в «десятки миллионов долларов» с Axel Springer SE, материнской компанией популярного издания Politico.
А в июле прошлого года OpenAI объявила о сделке с Associated Press, сумма которой не разглашается.
Как отмечается в публикации Bloomberg эти контракты имеют решающее значение для будущего OpenAI, так как компания сейчас пытается организовать стабильный приток больших объемов новых и достоверных данных для обучения моделей и вместе с тем усиливает контроль над источниками такой информации.
«Экзистенциальный» иск NYT против OpenAI
На прошлой неделе The New York Times подала в суд на OpenAI и Microsoft за использование своих статей и публикаций без разрешения.
Иск представляет собой экзистенциальную проблему для бизнеса OpenAI. Если Times выиграет дело, OpenAI может не только «попасть» на миллиарды долларов компенсации, но и рискует столкнуться с необходимостью уничтожить имеющиеся датасеты, содержащие данные Times, что само по себе является крайне сложной и дорогостоящей задачей.
Кроме того, юридический спор с NYT существенно усложняет OpenAI всю работу по заключению новых договоров с ведущими владельцами контента.
«Текущая ситуация сильно отличается от тех, с которыми издатели сталкивались в прошлом в сфере поиска и социальных сетей», — считает Рубин.
Он также добавил, что в данном случае контент применяется только для обучения ИИ, он не воспроизводится и не используется замены исходного или другого контента.
Аргументы NYT
Тем не менее в NYT пока категорически не согласны с такой позицией OpenAI и утверждают, что ChatGPT нагло и бесплатно копирует работы журналистов издания.
В своем иске издательство привело ряд примеров, когда ChatGPT выдает целые абзацы текста, почти дословно скопированные из публикаций в The New York Times.
Некоторые специалисты, впрочем, уже отметили тот факт, что в некоторых примерах ChatGPT специально ставилась задача воспроизвести контент Times. Но представители NYT по-прежнему уверены, что OpenAI именно ворует контент New York Times.
«Если Microsoft и OpenAI хотят использовать наши работы в коммерческих целях, то закон требует, чтобы они сначала получили наше согласие», — говорится в заявлении The New York Times. via