ㅤㅤЗдравствуйте, уважаемые читатели!
ㅤㅤВ данном выпуске мы продолжим обсуждать
ㅤㅤнейросети, конкретно фокусируясь на
ㅤㅤпроцессе создания изображений на основе
ㅤㅤтекстового описания, также известного
ㅤㅤкак "prompt".
Создание изображений на основе
текстового описания является одной из
увлекательных исследовательских областей
в сфере искусственного интеллекта. Эта
техника позволяет использовать нейронные
сети для генерации визуального контента
на основе вводимого текста.
Процесс создания изображений на
основе текстового описания обычно
включает в себя использование глубоких
генеративных моделей, таких как
генеративно-состязательные сети (GAN)
или вариационные автоэнкодеры (VAE).
Эти модели обучаются на больших наборах
данных, содержащих пары изображений и
соответствующих текстовых описаний.
Используя обученную модель, можно
подать текстовое описание в качестве
входных данных и получить соответствующее
изображение в качестве выходных данных.
Нейросеть анализирует текстовое описание
и генерирует изображение, которое
отражает содержание описания. Например,
можно подать текстовое описание "зеленая
трава, синее небо и деревья" и получить
изображение с элементами,
соответствующими этому описанию.
Из чистого любопытства я решила
объединить по две картины известных
художников вместе, чтобы узнать, как
бы выглядели их "дети". Для этого я
воспользовалась сервисом
"Bing Image Creator"
от компании Microsoft.
Он абсолютно бесплатный, но имеет
15 кредитов (даются еженедельно), с
помощью которых можно получить
желаемое изображение за относительно
небольшой промежуток времени. Однако
после использования предоставленных
кредитов изображения генерируются
медленнее. Данный сервис базируется на
усовершенствованной версии
DALL·E 3 от OpenAI.
В текстовую подсказку (prompt)
я вводила следующее:
"Соедини картины:
'А' (автор данной картины) +
'Б' (автор данной картины)"
Вот несколько результатов:
"Мона Лиза" - Леонардо да Винчи
"Звездная ночь" - Винсент Ван Гог
"Тайная вечеря" - Леонардо да Винчи
"Девушка с жемчужной серёжкой" - Ян Вермеер
"Герника" - Пабло Пикассо
"Крик" - Эдвард Мунк
ㅤㅤВ целом, создание изображений на
ㅤㅤоснове текстового описания представляет
ㅤㅤсобой увлекательную технику, которая
ㅤㅤдемонстрирует возможности современных
ㅤㅤнейронных сетей и открывает новые
ㅤㅤперспективы в области генерации
ㅤㅤвизуального контента.
Автор: Elysiaㅤㅤ
mini-бонус:
"Кошачья рок-группа под звездным небом"