Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

12 ноября 2023
Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.

Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.

Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.

Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.

В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.

Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть Genmo AI - Генерация видео

Genmo AI

Превращайте текст или изображения в профессиональные видеоролики без усилий с помощью искусственного интеллекта.

Генерация видео
Бесплатно
462 тыс
Нейросеть Face Swap by Remaker - Дипфейк

Face Swap by Remaker

Легко меняйте лица на своих фотографиях с помощью бесплатного, безопасного онлайн-инструмента. Идеально подходит для создания юмористических видеороликов, мемов и т. д.

Дипфейк
Бесплатно
Нейросеть Gen-3 by Runway - Генерация видео

Gen-3 by Runway

Gen-3 Alpha от Runway расширяет границы возможностей создания видео на основе искусственного интеллекта. Создавайте длинные, связные видеоролики, используя инструкции на естественном языке