Невозможно создать нейросеть вроде ChatGPT без использования материалов, защищенных авторским правом, заявляет OpenAI
OpenAI заявила, что создание инструментов, подобных их чат-боту ChatGPT, без доступа к материалам, защищенным авторским правом, было бы невозможно. Это заявление последовало на фоне усиливающегося давления на компании, работающие в области искусственного интеллекта, по поводу контента, используемого для обучения их продуктов.
Чат-боты, такие, как ChatGPT, и генераторы изображений, например Stable Diffusion, "обучаются" на огромном массиве данных, взятых из интернета, большая часть которых защищена авторским правом – юридической защитой от использования чьей-либо работы без разрешения.
В прошлом месяце The New York Times подал в суд на OpenAI и Microsoft, который является ведущим инвестором OpenAI и использует его инструменты в своих продуктах, обвиняя их в "незаконном использовании" своих материалов для разработки.
В своём обращении к Комитету по связям и цифровым технологиям Палаты лордов OpenAI заявила, что не могла бы обучить крупные языковые модели, такие как их модель GPT-4 – технология, лежащая в основе ChatGPT, – без доступа к авторским работам.
"Поскольку современное авторское право охватывает практически любые формы человеческого самовыражения – включая блоги, фотографии, посты на форумах, фрагменты программного кода и государственные документы – обучение ведущих моделей искусственного интеллекта без использования материалов, защищённых авторским правом, было бы невозможным", – сказано в обращении OpenAI, впервые опубликованном Telegraph.
Компания также добавила, что ограничение учебных материалов книгами и рисунками, не защищенными авторским правом, приведет к созданию неадекватных систем искусственного интеллекта: "Ограничение обучающих данных книгами и рисунками, созданными более столетия назад, может привести к интересному эксперименту, но не обеспечит системами искусственного интеллекта, которые отвечают потребностям сегодняшних граждан."
В ответ на иск NYT в блоге, опубликованном на своем сайте в понедельник, OpenAI заявила: "Мы поддерживаем журналистику, сотрудничаем с новостными организациями и считаем иск New York Times необоснованным."
Ранее компания заявила, что уважает "права создателей и владельцев контента". В защиту использования авторских материалов компании в области искусственного интеллекта обычно ссылаются на юридическую доктрину "добросовестного использования", которая позволяет использовать контент в определенных обстоятельствах без разрешения владельца. В своем обращении OpenAI заявила, что "законно, авторское право не запрещает обучение".
Иск NYT последовал за множеством других юридических претензий против OpenAI. Джон Гришэм, Джоди Пиколт и Джордж Р. Р. Мартин были среди 17 авторов, которые в сентябре подали в суд на OpenAI, обвиняя его в "систематической массовой краже".
Getty Images, владеющая одной из крупнейших фотобиблиотек в мире, подала в суд на создателя Stable Diffusion, компанию Stability AI, в США и в Англии и Уэльсе за предполагаемые нарушения авторских прав. В США группа музыкальных издателей, включая Universal Music, подала в суд на Anthropic, компанию, поддерживаемую Amazon, стоящую за чат-ботом Claude, обвиняя её в неправомерном использовании "бесчисленных" авторских текстов песен для обучения своей модели.
В другой части своего обращения к Палате лордов, отвечая на вопрос о безопасности ИИ, OpenAI заявила, что поддерживает независимый анализ своих мер безопасности. В обращении говорится, что компания поддерживает "ред-тиминг" подход к тестированию систем искусственного интеллекта, когда сторонние исследователи проверяют безопасность продукта, имитируя поведение недоброжелательных актёров.
OpenAI входит в число компаний, которые согласились сотрудничать с правительствами по тестированию безопасности своих наиболее мощных моделей до и после их развертывания, после соглашения, достигнутого на мировом саммите по безопасности в Великобритании в прошлом году.