Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

12 ноября 2023
Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.

Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.

Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.

Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.

В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.

Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Suno AI V4 - Музыка

Suno AI V4

Генератор музыки, способный создавать музыку с текстом. Этот искусственный интеллект может написать и спеть текст вашей песни

Музыка
Условно-бесплатно
Нейросеть Grok by xAI - Чат-бот

Grok by xAI

ИИ-помощник, созданный компанией xAI (Элон Маск). Он отвечает на ваши вопросы, основываясь на данных, полученных в режиме реального времени от пользователей X

Чат-бот
Условно-бесплатно
Платно — $8/мес
5.8 тыс
Нейросеть Suno AI V4 - Музыка

Suno AI V4

Генератор музыки, способный создавать музыку с текстом. Этот искусственный интеллект может написать и спеть текст вашей песни

Музыка
Условно-бесплатно