Блог Зоряны Матюшенко: Кому принадлежат наработки искусственного интеллекта и данные для обучения моделей?

22 января 2024 12:54

Зоряна Матюшенко, ІТ-юрист в Legal IT Group.

ИИ стремительно приобретает популярность, вызывает искреннее восхищение и беспокойство одновременно, ведь с его помощью значительно проще получить желаемую иллюстрацию под запрос, статью или промо-текст.

Однако, если подумать на шаг дальше, то кто является автором работ, созданных ИИ? Правомерно ли использование объектов авторского права других лиц для тренировки моделей ИИ? Предлагаю рассмотреть эти и другие вопросы в этой статье.

Права на созданные ИИ объектов

Итак, на первый взгляд, ChatGPT, Midjourhey и Dall-e кажутся прекрасными помощниками контент-мейкеров, копирайтеров, разработчиков и многих других. Несмотря на это на этапе работы с ним возникает вопрос: действительно ли исходный материал можно считать своим?

Однозначного ответа, как это часто бывает в юридическом мире, нет, ведь it depends, как говорится. Технологии движутся значительно быстрее законодательства, поэтому не все моменты четко урегулированы. Однако, определенное регулирование все же существует, поэтому его и рассмотрим.

Сам ChatGPT отвечает, что в большинстве случаев авторство на исходный материал принадлежит разработчикам алгоритмов и технологий, которые используются для его работы. Однако, если входные материалы были предоставлены пользователем, он может иметь право на авторство на созданный контент. Кроме того, в разных странах существуют различные правовые нормы и требования к авторству, поэтому от этого также может зависеть, кто будет автором сгенерированного контента.

И хотя ChatGPT часто прибегает к так называемым «галлюцинациям», когда придумывает информацию, которой не существует, то в этом случае он близок к правде.

В США Ведомство по авторским правам (U.S. Copyright Office) уже получает заявки на регистрацию произведений, включающих контент, созданный ИИ. 16 марта 2023 года упомянутый Copyright Office издал гайдлайн «Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence».

Согласно Гайдлайну ключевым моментом, на основе которого принимается решение о регистрации контента, созданного ИИ, является наличие «человеческого авторства» («human authorship»). Так, оценивая произведения, содержащие материал, созданный ИИ, Copyright Office будет опираться на то, является ли такое произведение человеческого авторства, а компьютер лишь вспомогательным инструментом. Иначе говоря, является ли вклад ИИ результатом «собственной оригинальной умственной концепции». Защищаться авторским правом будет также материал, созданный ИИ и существенно видоизмененный человеком после. Если же участие человека ограничилось описанием или «промптом» (запросом) для ИИ, то результат не подлежит регистрации.

Как уже можно было догадаться, универсальных критериев для определения степени такого креативного участия человека нет. Решение принимается индивидуально в каждой ситуации.

Следует также учитывать то, что ChatGPT не указывает источники, откуда он берет текст. Учитывая это, нельзя быть уверенным, что сама модель пользуется ими законно. Следовательно, есть риск того, что текст, сгенерированный ИИ, является плагиатом или иным образом нарушает права третьих лиц.

Кроме этого, никто не застрахован от сходства контента, выданного по вашему запросу и по запросу кого-то другого. Претендуя на уникальность и одновременное «упрощение жизни» можно получить 5 одинаковых или очень похожих образцов сгенерированного контента в разных точках мира. Также следует быть осторожным с тем, что контент, сгенерированный ИИ, не обязательно является точным из-за уже упомянутых «галлюцинаций».

В законодательстве Украины наблюдаем тот же принцип, при котором автором может быть только человек и будет иметь права на контент только в том случае, если приобщился творческой деятельностью к его созданию.

Британское законодательство определяет, что автором сгенерированного компьютером произведения является лицо, осуществившее меры, необходимые для создания произведения (section 9(3) The Copyright, Designs and Patents Act (CDPA) 1988). В CDPA также есть понятие произведения, созданного компьютером при таких обстоятельствах, что не существует автора-человека. Таким образом, для сгенерированного компьютером произведения в Соединенном Королевстве, авторство человека не влияет на то, является ли это произведение объектом авторского права. Это довольно специфическое регулирование, по сравнению с мировыми тенденциями.

Универсальной таблетки не существует, а потому в каждой ситуации авторство будет определяться индивидуально, в зависимости от обстоятельств и применяемого законодательства. Однако, прослеживается ключевой принцип: степень творческой вовлеченности пользователя в создание произведения ИИ имеет решающее значение при определении авторства.

Права на данные для тренировки моделей ИИ

Другим аспектом, заслуживающим внимания в отношении ИИ, является использование объектов авторства третьих лиц для тренировки моделей ИИ.

Недавно в США художники Сара Андерсен, Келли Мак-Кернан и Карла Ортис подали судебный иск против создателей артгенераторов на основе ИИ — Stable Diffusion, Midjourney и DreamUp. Они утверждают, что организации нарушили права миллионов художников, обучив свои модели ИИ на пяти миллиардах изображений, собранных из интернета без согласия оригинальных художников.

Кроме того, фотостоковая платформа Getty Images подала иск против компании Stability AI за нарушение авторских прав при тренировке ИИ.

Потенциально иски о нарушении прав могут быть направлены не только против разработчиков программ с искусственным интеллектом, но и против любого, кто будет пытаться использовать в коммерческой деятельности сгенерированные ими результаты.

Компания OpenAI в 2019 году, в комментарии в Бюро патентов и торговых марок США (United States Patent and Trademark Office) заявила, что использование алгоритмов машинного обучения, которые анализируют данные, защищенные авторским правом, для обучения, должно подпадать под добросовестное использование (fair use). Представители компании также отмечали, что противоположная позиция будет иметь «катастрофические последствия», «может привести к выводу инноваций в иностранную юрисдикцию» и «серьезно препятствовать творческим исследованиям в области ИИ». Собственно, fair use является основным аргументом компаний-разработчиков продуктов с ИИ в пользу использования объектов авторства третьих лиц для обучения своих программ.

Действительно, в США действует доктрина fair use, которая позволяет использование произведения, защищенного авторским правом, без разрешения владельца авторского права для таких целей как критика, комментарии, сообщение новостей, обучение, научная деятельность или исследования.

Однако, граница между правомерным использованием произведений третьих лиц в рамках доктрины fair use и нарушением авторских прав довольно тонкая и размытая, а потому позиция разных сторон может обрастать встречными аргументами. В делах, связанных с добросовестным использованием ИИ произведений авторства третьих лиц, есть много осложняющих факторов, в частности местонахождение компании (правовая юрисдикция) и цель такого использования. Имеет значение также объем защищенного материала, который использовался. Именно поэтому только суд после комплексного рассмотрения конкретного кейса сможет прийти к выводу о том, может ли считаться добросовестным использование произведений, авторские права на которые принадлежат третьим лицам, для обучения моделей ИИ.

Если сравнить такое использование некоммерческими и коммерческими компаниями, то некоммерческие компании более вероятно смогут ссылаться на то, что их случай действительно подпадает под fair use. Коммерческая цель значительно уменьшает шансы на защиту доктриной добросовестного использования. Однако, опять же, case by case 🙂

В то же время в ЕС действует Директива Европейского парламента и совета об авторском праве и смежных правах на Едином цифровом рынке, положениями статьи 4 которой допускается воспроизведение и изъятие правомерно доступных произведений и других объектов для целей глубинного анализа текстов и данных. Да, это положение можно использовать в защиту такого использования произведений третьих лиц для обучения моделей ИИ в ЕС.

Однако, и здесь не следует расслабляться. Во-первых, судебная практика может трактовать это положение иначе и создавать новые прецеденты. Во-вторых, еще не принятый AI Act, но предложения которого активно обсуждаются, содержит положение, обязывающее раскрывать органам надзора за рынком любой защищенный авторским правом материал, используемый для разработки ИИ, то есть для обучения также. В свою очередь, это может в корне изменить ситуацию.

Другую сторону претензий к генераторам ИИ-арта можно увидеть в коллективном иске о нарушении авторских прав против Microsoft, GitHub и OpenAI. В иске утверждается, что эти компании нарушили закон об авторском праве, сознательно используя защищенный открытый код для обучения своего ИИ. Этот иск от других отличает то, что он не содержит прямых обвинений в нарушении авторских прав, а опирается на положение Закона об авторском праве в цифровую эпоху(Digital Millennium Copyright Act), которое запрещает удалять из произведения «информацию об управлении авторскими правами», которая может включать сведения об авторстве и лицензии.

Практика пока только в начале своего формирования, поэтому спрогнозировать, какими будут будущие судебные решения, сложно. Можно предположить, что первые решения будут задавать дальнейшую тенденцию к рассмотрению подобных дел. В то же время, каждое дело будет рассматриваться с учетом индивидуальных обстоятельств, а потому решения могут приниматься без привязки к предыдущим в похожих кейсах.

Использование искусственного интеллекта в юриспруденции

Юристы также находят применение искусственному интеллекту в работе. В первую очередь ИИ может помочь с юридическими исследованиями. Если нужно отыскать информацию в совершенно неизвестной сфере, то можно прийти за навигацией к ИИ. Конечно, ориентиры надо проверять и не стоит ожидать, что вся работа будет сделана за вас 🙂

ИИ может чрезвычайно быстро обрабатывать большие объемы информации, что может пригодиться при выполнении определенных времязатратных задач. Кроме того, полезными инструменты ИИ могут быть при автоматизации документооборота и биллинга и даже подготовке драфтов документов.

При этом, следует быть осмотрительными с ресурсами, которые используются, и помнить о безопасности данных.

Использование ИИ в юридической отрасли.
Источник: https://technative.io/how-legal-ai-became-more-accurate-than-lawyers/

Використання ШІ в юридичній галузі.

Вывод

Подытожить можно тем, что использование сгенерированного контента, хоть и балансирует на грани с рисками, но все же, безусловно, является очень прогрессивным инструментом. Учитывая стремительное развитие технологий ИИ, вскоре можно ожидать появление более детального правового регулирования и формирования судебной практики.

Граница по определению авторства такого контента довольно размыта, а также существует вероятность нарушения авторских прав третьих лиц еще на этапе создания ИИ-арта, текста или иного исходного результата. Поэтому использовать ИИ нужно ответственно, чтобы он действительно эффективно помогал.

Так, в зависимости от ситуации и применимой юрисдикции контент, созданный ИИ может принадлежать:

  • разработчику или владельцу ИИ;
  • пользователю программы;
  • совместно разработчику/владельцу ИИ и пользователю или разработчику/владельцу ИИ и третьему лицу, или даже другой комбинации этих трех лиц, в зависимости от того, кто какой вклад внес в создание конечного произведения.

Кроме того, сгенерированный контент может не просто содержать долю творчества третьего лица, а и нарушать его авторские права на результаты своего творчества.

Вопрос правомерности использования объектов авторства третьих лиц без согласия авторов для обучения моделей ИИ также остается дискуссионным. В США действует доктрина fair use, которая, однако, не устанавливает одного четкого правила на все случаи, а потому следует комплексно учитывать совокупность таких обстоятельств как цель использования, юрисдикция, объем и природа контента, доля «чужого» материала в конечных результатах и др.

Переложить все рабочие задачи на искусственный интеллект не получится, но упростить жизнь он, конечно, может. В перспективе ИИ может стать обыденным инструментом, который повышает эффективность работы. Конечно, важно помнить о безопасности и конфиденциальности и ответственно подходить к взаимодействию с искусственным интеллектом.

В ЕС регулирование сейчас более лояльное в отношении авторства работ, сгенерированных ИИ, но идет активная работа над новым AI Act, который может стать новым глобальным стандартом в этой сфере. Поэтому держим руку на пульсе и следим за динамичным развитием законодательства.

Оригинал публикации: https://serpstat.com/uk/blog/komu-nalezhat-napratcyuvannya-shtuchnogo-intelektu/.

Віра Захарова
Редактор