Нейросети и их возможности стремительно развиваются, с каждым днем становясь всё лучше. И если еще полгода назад мы смотрели на абстрактные картинки, в которых порой с трудом угадывали очертания домов и пугались непропорциональных «людей». Но теперь генерируемые картинки стали максимально приближенными к реальности.
Почти год назад мы уже пробовали посмотреть на Кузбасс глазами нейросети Midjourney, которая дает возможность «нарисовать» что-либо по запросам, но количество бесплатно генерируемых картинок ограничено. Есть и бесчисленное количество других порталов, где можно создавать иллюстрации, но очень часто они слабо обучены, и поэтому изображения не слишком отличаются друг от друга. Поэтому мы решили пойти сложным путем и воспользовались не настроенным сервисом, а исходным кодом программы Stable Diffusion.
Главное отличие этой сети в том, что здесь мало написать «Вид на город Кемерово» или «Кузбассовец на берегу Томи», программа ничего толкового по этому запросу не сделает. Поэтому тут обращение к системе больше похоже на описание предметов на «Алиэкспресс», также необходимо отметить и те моменты, которые вы не хотите видеть на изображении. Но подобрав подходящий вариант итога, его можно использовать сколько угодно раз, и сгенерированные виды или люди будут разными.
Вот так, например, выглядят типичный кемеровчанин и рядовая новокузнечанка по мнению искусственного интеллекта. Глядя на эти картинки, можно подумать, что на них изображены реальные люди, но нет, в жизни вы их никогда не встретите.
Сгенерированные виды городов Кузбасса также сильно отличаются друг от друга. Вероятнее всего, какую-то часть картинки нейросеть берет, основываясь на реальных снимках городов, поэтому чаще всего по запросу «Кемерово» или «Белово» или любой другой город Кузбасса, получаются засыпанные снегом территории. Чтобы убрать его, мы сильно постарались, и вот что у нас вышло.
Все эти сгенерированные виды городов в целом не балуют детализацией. Но если в запрос напихать побольше слов, которые хочется видеть на изображении, оно заметно преображается.
Если опуститься на уровень улиц и домов, то оказывается, что нейросети пока всё же не очень понимают особенности городов. Это, в общем-то, и неудивительно. Кое-где «артефакты» и искажения всё же присутствуют, модельки и чекпойнты, используемые для генерации, неидеальны, но всё равно кажется, что где-то ты уже видел эту улицу, дом, перекресток.
А вы что думаете о картинках нейросети?