Lensa AI ворует у человеческого искусства? Эксперт объясняет противоречие

Lensa AI ворует у человеческого искусства? Эксперт объясняет противоречие A fake ArtStation-style portrait made in Stable Diffusion.

Приложение Lensa для редактирования фото и видео в последние недели стало популярным в социальных сетях после добавления функции, позволяющей создавать потрясающие цифровые портреты в стиле современного искусства.

Это делается всего за за небольшую плату и усилия по загрузке от 10 до 20 разных фотографий себя.

2022 год стал годом, когда технология искусственного интеллекта для преобразования текста в медиа вышла из лабораторий и начала колонизировать нашу визуальную культуру, и Lensa может стать лучшее коммерческое применение этой технологии на сегодняшний день.

Это зажгло огонь среди влиятельных лиц социальных сетей, стремящихся выделиться – и разного рода огонь среди арт-сообщества. Австралийская художница Ким Лютвайлер рассказала The Guardian, что узнавала стили конкретных художников, в том числе свой собственный стиль, в портретах Ленсы.

После Midjourney на сцену вышли Dall-E от OpenAI и Stable Diffusion от группы CompVis. в этом году легкость, с которой можно подражать стилям отдельных художников, прозвучала тревожным сигналом.

Художники чувствуют, что их интеллектуальная собственность — и, возможно, часть их души — была скомпрометирована. Но так ли это?

Ну, не так, как это рассматривается действующим законодательством об авторском праве.

Если это не прямая кража, то что?

Text-to Медиа-ИИ по своей сути очень сложен, но мы, не компьютерщики, можем понять его концептуально.

Чтобы по-настоящему понять положительные и отрицательные стороны Lensa, стоит сделать пару шагов назад, чтобы понять, как индивидуальные стили художников могут найти свое отражение в и из черных ящиков, на которых работают такие системы, как Lensa.

Lensa — это оптимизированный и настраиваемый интерфейс для свободно доступной модели глубокого обучения Stable Diffusion. Он назван так потому, что использует систему, называемую скрытой диффузией, для обеспечения творческого результата.

Слово «латентный» здесь ключевое. В науке о данных скрытая переменная — это качество, которое нельзя измерить напрямую, но о котором можно сделать вывод на основе вещей, которые можно измерить.

Когда создавалась стабильная диффузия, алгоритмы машинного обучения получали большое количество пар изображение-текст, и они научились миллиардам различных способов соединения этих изображений и подписей.

Это сформировало сложную базу знаний, ни один из которых не понятен людям напрямую. Мы можем видеть в его выводах «модернизм» или «густые чернила», но Stable Diffusion видит вселенную чисел и связей.

И все это происходит из сложной математики, включающей числа, сгенерированные из исходного изображения- текстовые пары.

Поскольку система принимает как описания, так и данные изображения, она позволяет нам проложить курс через огромное море возможных выходных данных, вводя осмысленные подсказки.

Возьмите изображение ниже. В качестве примера. Текстовая подсказка включала термины «цифровое искусство» и «artstation» — сайт, на котором живут многие современные цифровые художники.

Во время обучения Stable Diffusion научилась связывать эти слова с определенными качествами, которые она определила в различные произведения искусства, на которых он обучался. В результате получается изображение, которое хорошо подходит для ArtStation.

Поддельный портрет человека с темными волосами в пучке в стиле ArtStation , сделанный в Stable Diffusion.
Фальшивый портрет в стиле ArtStation, сделанный в Stable Diffusion, идеально поместился бы на сайте . (Стабильная диффузия)

Что отличает Lensa?

Итак, если стабильная диффузия — это система преобразования текста в изображение, в которой мы перемещаемся по различным возможностям, то Lensa кажется совсем другое, поскольку он воспринимает образы, а не слова. Это связано с тем, что одним из самых больших нововведений Lensa является оптимизация процесса инверсии текста.

Lensa берет предоставленные пользователями фотографии и вводит их в существующую базу знаний Stable Diffusion, обучая систему тому, как «фиксировать» особенности пользователя, чтобы затем он может стилизовать их. Хотя это можно сделать с помощью обычного стабильного рассеивания, это далеко не упорядоченный процесс.

Хотя вы не можете перемещать изображения в Lensa в каком-либо конкретном желаемом направлении, компромисс заключается в большом разнообразии варианты, которые почти всегда впечатляют. Эти изображения заимствуют идеи из работ других художников, но не содержат реальных фрагментов их работ.

Австралийский центр права в области искусства разъясняет, что, хотя отдельные произведения являются объектами авторского права, стилистические элементы и идеи за ними нет. Точно так же в деле Dave Grossman Designs Inc. против Бортина в США было установлено, что закон об авторском праве не применяется к художественному стилю.

А как насчет художников?

Тем не менее, тот факт, что художественные стили и техники, которые теперь могут быть переданы таким образом, чрезвычайно разрушительны и чрезвычайно огорчают художников. По мере того, как такие технологии, как Lensa, становятся все более популярными, а художники чувствуют себя все более ограбленными, может возникнуть необходимость в адаптации законодательства к ним.

Для художников, которые работают на небольших работах, таких как создание цифровых иллюстраций для влиятельных лиц. или других веб-предприятий, будущее выглядит сложным.

Однако, хотя с помощью ИИ легко создать хорошо выглядящую иллюстрацию, по-прежнему сложно создать очень конкретную работу с определенной темой и контекстом. Таким образом, независимо от того, как такие приложения, как Lensa, изменяют способ создания искусства, личность художника остается важным контекстом для их работы.

Возможно, самим художникам придется позаимствовать страницу у влиятельного лица. руководство и прилагать больше усилий к рекламе себя.

Это первые дни, и это будет бурное десятилетие для производителей и потребителей искусства. Но одно можно сказать наверняка: джин выпущен из бутылки.Разговор

Брендан Пол Мерфи, Лектор по цифровым медиа, CQUniversity Australia

Эта статья перепечатана из The Conversation под лицензией Creative Commons. Прочтите исходную статью.

logo