Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

12 ноября 2023
Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.

Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.

Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.

Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.

В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.

Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Canva Text to Image - Генерация изображений,Маркетинг,Дизайн

Canva Text to Image

Превращайте текст в потрясающие визуальные образы без особых усилий с помощью искусственного интеллекта для творчества.

Генерация изображений
Маркетинг
Дизайн
Условно-бесплатно
Платно — $4.08/мес
527 млн
Нейросеть Kinetix - 3D и анимация

Kinetix

Нейросеть для создания 3D-анимации даже без каких-либо знаний

3D и анимация
Бесплатно
Платно — $0.10/emote generated
18 тыс
Нейросеть PimEyes - Определение ИИ,Копирайтинг,SMM

PimEyes

Отдайте одну из своих фотографий искусственному интеллекту и узнайте, где вы появляетесь в Интернете

Определение ИИ
Копирайтинг
SMM
Условно-бесплатно
Платно — $29.99/мес
6 млн