Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

12 ноября 2023
Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.

Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.

Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.

Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.

В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.

Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Ideogram 2.0 - Генерация изображений,Генерация логотипа

Ideogram 2.0

Генератор изображений, способный создавать впечатляющие иллюстрации и интегрировать в них текст. Идеально подходит для создания логотипов, раскадровок, рекламных баннеров и т. д.

Нейросеть Roamaround - Маркетинг,Продуктивность,Наука и исследования

Roamaround

Генератор туристических маршрутов с помощью искусственного интеллекта. Простой и удобный в использовании сайт

Нейросеть Lexica.art - Генерация изображений,Промпты

Lexica.art

Невероятное количество подсказок для создания высококачественных изображений на Stable Diffusion

Генерация изображений
Промпты
Условно-бесплатно
Платно — $8/мес
4 млн