Может ли нейросеть облапать натурщицу? Может ли нейросеть уехать в Питер и спиться? Может ли нейросеть делать мемы? На первые два вопроса ответ будет однозначно отрицательным – у неё ведь нет ручек, чтобы трогать женщин, и рта, чтобы пить. Да и денег, чтобы платить за то и другое. А что касается мемов – почему бы не попробовать? Почему бы не посмотреть, как справятся разные нейросети с этим тонким и переменчивым порождением массовой культуры.
Цели у этого эксперимента никакой нет. Я тыкаю в нейросети и смотрю, как они реагируют – мне от этого весело, результатом делюсь тут. Заранее извиняюсь, если моё чувство юмора покажется кому-то кринжовым – у меня его просто нет.
Нейросетей сейчас развелось огромное множество. Вернее сайтов, которые предоставляют доступ к генератору картинок. Самих нейросетей гораздо меньше. В большинство случаев сервисы, где можно опробовать сие чудо науки и программирования, работают на базе Stable Diffusion.
Она распространяется бесплатно и каждый может скачать её прямо себе на комп, правда для работы ей требуется довольно много видеопамяти, а значит топовая видеокарта и машина, способная её обслуживать. У меня такой нет и вряд ли появится в ближайшее время (хотя создатели нейросети обещали скоро выпустить менее требовательную версию), поэтому я использовала чужие сервисы.
Дабы эксперимент был честным, всем опробованным нейросетям я задавала два запроса – «мем про роботов и людей» и «мем из трёх кадров, на первом Уилл Смит смотрит влево, на втором белый робот смотрит вправо, на третьем грустный Уилл Смит». Вторым запросом я пыталась добиться подобия известного мема –
Разумеется, запросы были на английском – этот язык роботы пока понимают лучше всего.
Если нейросеть не понимала запроса целиком, то я пыталась добиться от неё хотя бы подходящих для мема кадров, иногда заменяя слова.
DALL-E mini
Начать я решила с DALL-E mini. В основном потому, что она была первой нейросетью, о которой я услышала. И потому что искать доступ к более продвинутой и крутой DALL-E 2 мне было лень.
Как это ни странно, но маленькая и убогая нейросеть «предыдущего поколения» понимает концепцию мема лучше многих продвинутых.
Она знает, что в нём чаще всего есть кадры и буквы. С последними у неё проблема, но мясной художник всегда может добавить недостающее — как я и сделала.
Она даже умеет в эмоции. Правда люди у неё получаются плохо. И качество картинок очень низкое.
Таков результат второго запроса — надписи я, разумеется, добавила сама. Не очень хорошо, но и не ужасно.
Midjourney
Следующей нейросетью для экспериментов стала прославленная Midjourney. Забегая вперёд, скажу, что это самая удобная и сообразительная из опробованных мной. Но с мемами справляется не очень.
Очеловечивание рождается в голове человека, и глупо будет приписывать набору кода чувства, однако на запрос «мем про роботов и людей» Midjourney будто бы сразу обозначила, что не понимает, что от неё хотят.
И это лучший вариант — вернее, наиболее похожий на классический мем. Другие были ближе к обычным артам про роботов. Нельзя сказать, что понятие мема ей совершенно не знакомо — в конце концов тут есть кадры и эмоции, а юмор даже для людей — сложная неоднозначная штука. Однако видно, что она не приспособлена для такого.
Второй запрос целиком получить не удалось, однако из четырёх предложенных вариантов было легко собрать узнаваемую раскадровку. Мем с Уиллом Смитом получился жутковат.
Однако, хоть мемы ей недоступны, с другими вещами Midjourney справляется отлично. Её Ктулху почти убедил меня оплатить подписку, хотя и получился далеко не с первого раза.
neural.love
Следующей стала нейросеть от neural.love. И это самый неудобный генератор картинок из опробованных мной.
Свободный мем про роботов и людей получился настолько крив, что его нельзя отнести ни к мемам, ни к качественным артам. А это мем с Уиллом Смитом, спорящим с роботом о ценности искусства:
Очень часто возникало ощущение, что когда она не понимает запрос, то выдаёт рандомную картинку в заданном стиле (стиль можно настроить в строке для текста). И вроде бы картинка красивая и приемлемая, но совершенно не то, что нужно было.
(да и стоит она дороже, чем Midjourney)
DreamStudio
К этому времени я уже отчаялась обрадовалась, что хотя бы создание тупых мемов наступающий киберпанк ещё не отобрал у нас, но нет. По первому же требованию генератор от DreamStudio на основе всё той же Stable Diffusion выдал мне приемлемый мем.
Великолепный результат. Кадры, буквы – всё на месте. Смысла нет, но это не удивительно – нейросеть просто выдаёт картинку по тексту, а осмысливать её уже работа для человека.
Получить целиком второй запрос или хотя бы все кадры для него в одном запросе мне не удалось, а вот собрать по отдельности – запросто. К тому же генератор отлично понимает эмоции:
Счастливых роботов, правда, показывает немного странно, но и так сойдёт.
В остальных запросах DreamStudio тоже весьма неплоха, однако во многом уступает Midjourney. В простоте управления в том числе — если Midjourney может выдать годноту по первому же запросу, а вторым-третьим останется только доработать её, то в DreamStudio придётся потыкать раз 10, прежде чем она выдаст приемлемый результат.
***
Кроме этих четырёх была ещё и пятая – нейросеть от Artbreeder, рисующая по наброску. Однако добиться хоть сколько-нибудь внятного рисунка мне не удалось.
Такой вот получился эксперимент. По итогу могу сказать, что из опробованных мной сервисов, отплаченной подписки более всего достойна Midjourney.