Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

12 ноября 2023
Авторы обеспокоены использованием 183 000 книг для обучения нейросетей

Почти 200 000 книг, включая произведения таких известных авторов, как Дж.К. Роулинг, Амитав Гхош, Рупи Каур и Нил Гейман, используются крупнейшими технологическими компаниями для обучения их генеративных моделей искусственного интеллекта. Эти книги входят в набор данных пиратских книг, известный как Books3, и авторы об этом даже не подозревают.

Коллекция включает в себя произведения от эротической литературы до прозаической поэзии и помогает системам генеративного ИИ научиться передавать информацию. Однако использование этих книг вызвало возмущение среди авторов, многие из которых выразили свое недовольство в социальных сетях, поделившись скриншотами, показывающими, что их авторские романы входят в этот список.

Мэри Х.К. Чой, автор книги "Emergency Contact" и бестселлера New York Times, выразила свое возмущение после того, как узнала, что ее работа используется нейросетью. Она заявила, что чувствует себя опустошенной и одновременно совершенно беспомощной, и что использование ее книги в качестве данных для ИИ умаляет не только финансовую сторону для авторов, но и лишает книготорговцев, библиотекарей и читателей многих интимных аспектов.

Мин Джин Ли, автор романов "Пачинко" и "Бесплатная еда для миллионеров", также выразила разочарование и назвала использование ее книг "воровством". Она заявила, что потратила три десятилетия своей жизни на написание своих книг и что крупные языковые модели ИИ не "поглощают" или "скребут" данные, а компании, занимающиеся ИИ, украли ее труд, творчество и истории.

В ответ на это представитель Bloomberg сообщил CNN, что компания использовала различные источники данных, включая Books3, для обучения своей первоначальной модели BloombergGPT, модели ИИ для финансовой индустрии. Однако в будущем Bloomberg не будет включать набор данных Books3 в число источников данных, используемых для обучения коммерческих версий BloombergGPT.

Тем не менее, автор Джеймс Чаппел не возражает против использования своей книги в базе данных. Он написал, что хочет, чтобы его книгу читали и чтобы она обучала.

Новости и обзоры

Читать все

Нейросети

смотреть все
Нейросеть AI Dungeon - Игры,Сторителлинг

AI Dungeon

Текстовая приключенческая игра на основе искусственного интеллекта GPT, позволяющая создавать бесконечные истории. Доступна как в одиночном, так и в многопользовательском режиме

Нейросеть MidJourney V6.1 - Генерация изображений

MidJourney V6.1

Мощный генератор изображений на основе текстового описания (Discord + Web)

Генерация изображений
Условно-бесплатно
17 млн
Нейросеть SearchGPT - Расширения ChatGPT,Поисковые системы

SearchGPT

Функция веб-поиска, интегрированная в ChatGPT. Получайте актуальные ответы со ссылками на источники и данными в режиме реального времени. Примеры: мировые новости, погода, спорт, фондовый рынок и т. д.