Эксперименты: делаем стоковые фото для сайта с помощью нейросетей
05.04.2024 👁 1120
Сегодня мы хотели бы рассказать о возможности использования нейросети для преобразования готовых изображений в текст, а затем измиенение этого запроса-текста и создание своего изображения с помощью другой нейросети, которое будет уникально и его можно использовать для своих проектов.
А также попробуем сами на нескольких картинках, как будет получаться у нас.
Такой текст называется промт
Промт может включать в себя различные элементы, которые помогают модели работать более эффективно.
- Например, инструкция — это условие или задача, которую модель должна выполнить
- Контекст — это дополнительная информация от пользователя, которая может помочь модели
- Входные данные — это вопрос, ответ на который модель должна выдать. Индикатор вывода - это формат, в котором модель должна выдать свой ответ
Логика работы проста
- Вы загружаете понравившуюся картинку в нейросеть, которая выдаст промт (image-to-prompt) по ней
- Затем, вы модифицуруете промпт (обучно добавляя фотореалистично или как на фотостоке) вставляете получившийся текст в другую нейросеть, которая генерирует изображения
Таким образом, вы получаете финальный результат, похожий на оригинал.
Это может быть полезно, если картинка полностью соответствует вашим требованиям, но она имеет авторские права и не может быть использована в коммерческих целях. С помощью этого помощника, вы сможете обойти эти ограничения!
В дальнейшем можно дополнять промпт и пытаться улучшить изображение до нужного результата. Хотя текущие нейросети почти всгда "забывают", о чем была речь ранее и генерят новую картинку.
попробуем КАК это работает
Случай №1. Котик. Все любят котиков.
Оригинал фотографии кота мы скачали из интернет, поэтому изменим его (красные линии и красный текст), чтобы нас не привлекли правообладатели.
1. Незамедлительно залетаем на сайт преобразования картинки в промпт (image-to-prompt)
2. Через 2-3 минуты получаем такой промпт: "a black and white cat sitting on top of a wooden table, shutterstock, realism, an indifferent face, sitting on a wooden dock, with a white nose, toxic cat"
— Токсик кэт?! Вот даже в нюансы умеют нейросетки - кот на нас пялится с выражением "как на ..вно" поэтому видимо токсик ;)
3. Чутка дополняем промпт словом photorealistic (используем английский язык, если не владеем -- то прыг сюда) и в Bing Designer генерируем это:
— Почти то что нужно! Но кот не лежит как на оригинале! Дополняем промпт:
the cat should be lying down, the cat's back should be out of focus (кот должен лежать, спина кота быть в расфокусе)
4. Получаем такие варианты:
Ну вот — другое дело!
Случай №2. СТроитель для сайта
Попробуем более полезный вариант — создадим картинку для иллюстрации сайта строителей.
1. Оригинальная картинка (также ее изменили порисовав красным)
1. Переходим на сайт преобразования картинки в промпт (image-to-prompt)
2. Через некоторое время получаем такой промпт: "a man in a hard hat sitting at a table, shutterstock, instructions to build it, smiling male, gambrel roof building, 30 year old man"
мужчина в каске сидит за столом, shutterstock, инструкции по строительству, улыбающийся мужчина, строительство двускатной крыши, мужчина 30 лет
3. Дополняем промпт словом photorealistic like a stock photo и в Bing Designer генерируем это:
Недурно! Но немного не то. Попробуем дополнить промпт: "Use a european face of a man without a beard, and the background should be a gray plastered wall, as well as a construction gray streman and part of an assembled white cabinet"
Используйте европейское лицо мужчины без бороды, а фоном должна быть серая оштукатуренная стена, а также строительный серый стремянка и часть собранного белого шкафа
4. Получаем следующие варианты:
Мощно! Брутальность зашкаливает. Хотя про бороду облом — видимо нейросетку учили, что 30+ лет и строитель — это борода онли. Ну да ладно.
5. Попробуем еще чутка в дополнение диалога с нейросеткой написать следующее: "Use the third option, but add more light to the room and pencil and paper to the builder's hands and it's more photorealistic"
Используй третий вариант, но добавь больше света в комнату и карандаш и бумагу в руки строителя, и более фотореалистично.
Получаем такие варианты (опять +- то же самое)
В принципе, хорошие варианты. Хотя оригинала мы не добились.
Но видимо, нужно пробовать самому подробно описывать картинку, а не лениться с помощью распознавающей сетки ;)
Но в любом случае, комбинируя различные нейросети, вы получаете мощные инструменты для творчества, которые помогут вам выйти на новый уровень в бизнесе!