Генерируем картинки с помощью ИИ StableDiffusion

Aleksandr Limm
4 min readOct 23, 2022

--

В 2020 году появились первые публичные сервисы, позволяющие генерировать картинки с помощью текстового запросу к ИИ. Одними из таких ресурсов были HotPot AI и Artbreeder. В основе графических генераций стоят нейросети обученные на десятках миллиардов изображений.

StableDiffusion (SD) — один из ведущих искусственных интеллектов для генерации изображений

Отличительная черта SD — открытость, исходный код доступен, поэтому энтузиасты могут улучшать модель и вносить в неё новшества совместно.

Вы можете зарегиcтрироваться на указанных сайтах с помощью Google аккаунта и сразу же приступить к генерациям на последних версиях модели Stable Diffusion.

dreamlike.art

dreamstudio.ai

Как написать запрос на генерацию изображения в StableDiffusion?

🇺🇸 Запросы пишутся на английском языке, если что используйте переводчики Google и DeepL.

Вариантов запросов существует бесконечное множество, но в общем, есть некоторые универсальные подходы.

Универсальная формула запроса к ИИ:

[Форма] + [Описание] + [Стиль]

[Форма] определяет в каком общем виде будет генерация.

например: иллюстрация (illustration), портрет (portrait), фотография (photo), граффити (graffiti), наскальная живопись…

[Что изобразить] что или кого рисовать ИИ.

например: дерево, космический корабль, рыцарь, Ленин, вечеринка на Гавайях, историческое событие, момент из кинофильма

[Модификаторы] часть запроса, которая указывает на стиль изображения и в целом может быть очень разнообразной.

например, в качестве модификатора можно использовать имя художника, в стиле которого вы хотите получить изображение (Пикассо, Малевич, Бэнкси)

также модификаторами могут служить обще-стилистические названия предметов искусства (в стиле… экспрессионизм, брутализм, абстракция, сюрреализм)

На сайте 🦩 lexica.art можно ознакомится с галлерей сгенерированных изображений и подобрать подходящие слова для своего запроса

Что такое Guidance Scale (CFG), Steps (denoising), Aspect Ratio

Guidance Scale (CFG Scale) отвечает за то, насколько искуственный интеллект должен приблизиться к буквальному изображению запроса. Чем ниже Cfg Scale — тем креативнее будет ИИ. Чем выше Cfg Scale тем более точно ИИ будет пытаться изобразить запрос.

Steps (denoising) отвечает за то, сколько раз (итерации) ИИ должен улучшить изображение перед завершением генерации. Чем выше настройка Steps (denoising), тем будет выше качество готового изображения. Ставим на максимум.

Aspect Ratio. Вы можете указать пропорции генерируемого изображения: Square (1:1), Portrait (3:4), Landscape (4:3), Mobile (9:16), Desktop (16:9)

Зачем генерировать картинки? Где может применятся Stable Diffusion?

Ответ предстоит найти вам самим 🙏

--

--

No responses yet