28.11.2024
мемы про роботов и людей

Может ли нейросеть создавать мемы?

Может ли нейросеть облапать натурщицу? Может ли нейросеть уехать в Питер и спиться? Может ли нейросеть делать мемы? На первые два вопроса ответ будет однозначно отрицательным – у неё ведь нет ручек, чтобы трогать женщин, и рта, чтобы пить. Да и денег, чтобы платить за то и другое. А что касается мемов – почему бы не попробовать? Почему бы не посмотреть, как справятся разные нейросети с этим тонким и переменчивым порождением массовой культуры.

Цели у этого эксперимента никакой нет. Я тыкаю в нейросети и смотрю, как они реагируют – мне от этого весело, результатом делюсь тут. Заранее извиняюсь, если моё чувство юмора покажется кому-то кринжовым – у меня его просто нет.

Нейросетей сейчас развелось огромное множество. Вернее сайтов, которые предоставляют доступ к генератору картинок. Самих нейросетей гораздо меньше. В большинство случаев сервисы, где можно опробовать сие чудо науки и программирования, работают на базе Stable Diffusion.

Она распространяется бесплатно и каждый может скачать её прямо себе на комп, правда для работы ей требуется довольно много видеопамяти, а значит топовая видеокарта и машина, способная её обслуживать. У меня такой нет и вряд ли появится в ближайшее время (хотя создатели нейросети обещали скоро выпустить менее требовательную версию), поэтому я использовала чужие сервисы.

Дабы эксперимент был честным, всем опробованным нейросетям я задавала два запроса – «мем про роботов и людей» и «мем из трёх кадров, на первом Уилл Смит смотрит влево, на втором белый робот смотрит вправо, на третьем грустный Уилл Смит». Вторым запросом я пыталась добиться подобия известного мема –

Разумеется, запросы были на английском – этот язык роботы пока понимают лучше всего.

Если нейросеть не понимала запроса целиком, то я пыталась добиться от неё хотя бы подходящих для мема кадров, иногда заменяя слова.

DALL-E mini

Начать я решила с DALL-E mini. В основном потому, что она была первой нейросетью, о которой я услышала. И потому что искать доступ к более продвинутой и крутой DALL-E 2 мне было лень.

Как это ни странно, но маленькая и убогая нейросеть «предыдущего поколения» понимает концепцию мема лучше многих продвинутых.

Она знает, что в нём чаще всего есть кадры и буквы. С последними у неё проблема, но мясной художник всегда может добавить недостающее — как я и сделала.

Она даже умеет в эмоции. Правда люди у неё получаются плохо. И качество картинок очень низкое.

Таков результат второго запроса — надписи я, разумеется, добавила сама. Не очень хорошо, но и не ужасно.

Midjourney

Следующей нейросетью для экспериментов стала прославленная Midjourney. Забегая вперёд, скажу, что это самая удобная и сообразительная из опробованных мной. Но с мемами справляется не очень.

Очеловечивание рождается в голове человека, и глупо будет приписывать набору кода чувства, однако на запрос «мем про роботов и людей» Midjourney будто бы сразу обозначила, что не понимает, что от неё хотят.

мем от Midjourney

И это лучший вариант — вернее, наиболее похожий на классический мем. Другие были ближе к обычным артам про роботов. Нельзя сказать, что понятие мема ей совершенно не знакомо — в конце концов тут есть кадры и эмоции, а юмор даже для людей — сложная неоднозначная штука. Однако видно, что она не приспособлена для такого.

Второй запрос целиком получить не удалось, однако из четырёх предложенных вариантов было легко собрать узнаваемую раскадровку. Мем с Уиллом Смитом получился жутковат.

Однако, хоть мемы ей недоступны, с другими вещами Midjourney справляется отлично. Её Ктулху почти убедил меня оплатить подписку, хотя и получился далеко не с первого раза.

neural.love

Следующей стала нейросеть от neural.love. И это самый неудобный генератор картинок из опробованных мной.

Свободный мем про роботов и людей получился настолько крив, что его нельзя отнести ни к мемам, ни к качественным артам. А это мем с Уиллом Смитом, спорящим с роботом о ценности искусства:

Очень часто возникало ощущение, что когда она не понимает запрос, то выдаёт рандомную картинку в заданном стиле (стиль можно настроить в строке для текста). И вроде бы картинка красивая и приемлемая, но совершенно не то, что нужно было.

(да и стоит она дороже, чем Midjourney)

DreamStudio

К этому времени я уже отчаялась обрадовалась, что хотя бы создание тупых мемов наступающий киберпанк ещё не отобрал у нас, но нет. По первому же требованию генератор от DreamStudio на основе всё той же Stable Diffusion выдал мне приемлемый мем.

Великолепный результат. Кадры, буквы – всё на месте. Смысла нет, но это не удивительно – нейросеть просто выдаёт картинку по тексту, а осмысливать её уже работа для человека.

Получить целиком второй запрос или хотя бы все кадры для него в одном запросе мне не удалось, а вот собрать по отдельности – запросто. К тому же генератор отлично понимает эмоции:

Счастливых роботов, правда, показывает немного странно, но и так сойдёт.

В остальных запросах DreamStudio тоже весьма неплоха, однако во многом уступает Midjourney. В простоте управления в том числе — если Midjourney может выдать годноту по первому же запросу, а вторым-третьим останется только доработать её, то в DreamStudio придётся потыкать раз 10, прежде чем она выдаст приемлемый результат.

***

Кроме этих четырёх была ещё и пятая – нейросеть от Artbreeder, рисующая по наброску. Однако добиться хоть сколько-нибудь внятного рисунка мне не удалось.

Такой вот получился эксперимент. По итогу могу сказать, что из опробованных мной сервисов, отплаченной подписки более всего достойна Midjourney.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *