Компания Reddit официально обвинила стартап Anthropic в несанкционированном сборе контента для обучения чат-бота Claude. Иск подан в Верховный суд Сан-Франциско и требует возмещения убытков за нарушение авторских прав и условий пользовательского соглашения.
По словам представителей Reddit, Anthropic использовала автоматизированные скрипты для парсинга публичных и приватных веток обсуждений на платформе. В результате AI-модель Claude получила доступ к миллионам постов и комментариев без согласия авторов и без оплаты соответствующих лицензий.
В судебных документах акцентируется внимание на том, что Reddit несколько раз направляла запросы к Anthropic о прекращении сбора контента. Несмотря на это, спор продолжился, а масштаб извлечения данных вырос до сотен терабайт информации.
Представители Reddit заявили: «Несанкционированное извлечение пользовательского контента подрывает доверие к платформе и наносит ущерб авторам. Мы защищаем права создателей качества и платим за легальное использование данных».
В ответной позиции Anthropic утверждает, что большая часть данных была взята из общедоступных источников без нарушения закона. Компания также подчёркивает, что AI-модели обучаются на массивах публичной информации в рамках принципа добросовестного использования.
Юридические эксперты отмечают: исход этого дела может установить важный прецедент в спорах между онлайн-платформами и разработчиками искусственного интеллекта. Решение суда покажет, насколько масштабная автоматизация сбора данных допустима без прямого разрешения правообладателей.
Стороны пока не объявили дату первого слушания, однако ожидается, что дело привлечёт повышенное внимание сообщества разработчиков и владельцев контента. Аналитики полагают, что исход спора повлияет на дальнейшее развитие правил лицензирования данных в эпоху искусственного интеллекта.