Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.
Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.
Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.
Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.
В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.
Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.