Эксперименты: делаем стоковые фото для сайта с помощью нейросетей

05.04.2024     👁 1120


Сегодня мы хотели бы рассказать о возможности использования нейросети для преобразования готовых изображений в текст, а затем измиенение этого запроса-текста и создание своего изображения с помощью другой нейросети, которое будет уникально и его можно использовать для своих проектов.

А также попробуем сами на нескольких картинках, как будет получаться у нас.

Такой текст называется промт

Промт может включать в себя различные элементы, которые помогают модели работать более эффективно.

  • Например, инструкция — это условие или задача, которую модель должна выполнить
  • Контекст — это дополнительная информация от пользователя, которая может помочь модели
  • Входные данные — это вопрос, ответ на который модель должна выдать. Индикатор вывода - это формат, в котором модель должна выдать свой ответ

Логика работы проста

  1. Вы загружаете понравившуюся картинку в нейросеть, которая выдаст промт (image-to-prompt) по ней
  2. Затем, вы модифицуруете промпт (обучно добавляя фотореалистично или как на фотостоке) вставляете получившийся текст в другую нейросеть, которая генерирует изображения

Таким образом, вы получаете финальный результат, похожий на оригинал.

Это может быть полезно, если картинка полностью соответствует вашим требованиям, но она имеет авторские права и не может быть использована в коммерческих целях. С помощью этого помощника, вы сможете обойти эти ограничения!

В дальнейшем можно дополнять промпт и пытаться улучшить изображение до нужного результата. Хотя текущие нейросети почти всгда "забывают", о чем была речь ранее и генерят новую картинку.


попробуем КАК это работает

Случай №1. Котик. Все любят котиков.

Оригинал фотографии кота мы скачали из интернет, поэтому изменим его (красные линии и красный текст), чтобы нас не привлекли правообладатели.

1. Незамедлительно залетаем на сайт преобразования картинки в промпт (image-to-prompt)

2. Через 2-3 минуты получаем такой промпт: "a black and white cat sitting on top of a wooden table, shutterstock, realism, an indifferent face, sitting on a wooden dock, with a white nose, toxic cat"

— Токсик кэт?! Вот даже в нюансы умеют нейросетки - кот на нас пялится с выражением "как на ..вно" поэтому видимо токсик ;)

3. Чутка дополняем промпт словом photorealistic (используем английский язык, если не владеем -- то прыг сюда) и в Bing Designer генерируем это:

 
 

— Почти то что нужно! Но кот не лежит как на оригинале! Дополняем промпт:

the cat should be lying down, the cat's back should be out of focus (кот должен лежать, спина кота быть в расфокусе)

4. Получаем такие варианты:

 
 

Ну вот — другое дело!

Случай №2. СТроитель для сайта

Попробуем более полезный вариант — создадим картинку для иллюстрации сайта строителей.

1. Оригинальная картинка (также ее изменили порисовав красным)

1.  Переходим на сайт преобразования картинки в промпт (image-to-prompt)

2. Через некоторое время получаем такой промпт: "a man in a hard hat sitting at a table, shutterstock, instructions to build it, smiling male, gambrel roof building, 30 year old man"

мужчина в каске сидит за столом, shutterstock, инструкции по строительству, улыбающийся мужчина, строительство двускатной крыши, мужчина 30 лет

3. Дополняем промпт словом photorealistic like a stock photo и в Bing Designer генерируем это:

 
 

Недурно! Но немного не то. Попробуем дополнить промпт:  "Use a european face of a man without a beard, and the background should be a gray plastered wall, as well as a construction gray streman and part of an assembled white cabinet"

Используйте европейское лицо мужчины без бороды, а фоном должна быть серая оштукатуренная стена, а также строительный серый стремянка и часть собранного белого шкафа

4. Получаем следующие варианты:

 
 

Мощно! Брутальность зашкаливает. Хотя про бороду облом — видимо нейросетку учили, что 30+ лет и строитель — это борода онли. Ну да ладно.

5. Попробуем еще чутка в дополнение диалога с нейросеткой написать следующее: "Use the third option, but add more light to the room and pencil and paper to the builder's hands and it's more photorealistic"

Используй третий вариант, но добавь больше света в комнату и карандаш и бумагу в руки строителя, и более фотореалистично.

Получаем такие варианты (опять +- то же самое)

 
 

В принципе, хорошие варианты. Хотя оригинала мы не добились.

Но видимо, нужно пробовать самому подробно описывать картинку, а не лениться с помощью распознавающей сетки ;)

Но в любом случае, комбинируя различные нейросети, вы получаете мощные инструменты для творчества, которые помогут вам выйти на новый уровень в бизнесе!

 



Подписывайся на наш Телеграм

Подписывайся на наш
Телеграм канал!
Контекст решает