Главное Авторские колонки Вакансии Вопросы
Выбор редакции:
😼
Выбор
редакции
235 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Я устал от пластиковых лиц в Midjourney. И, кажется, нашел нейросеть, которая генерирует «живые» фотографии

Давайте начистоту: я люблю Midjourney. Но в последнее время, пролистывая свои же генерации, я все чаще ловлю себя на мысли, что смотрю на мир красивых, но безжизненных манекенов. Идеальная кожа без единой поры, выверенные до миллиметра позы, одинаковый стеклянный взгляд.
Мнение автора может не совпадать с мнением редакции


Эта «нейросетевая эстетика» стала настолько узнаваемой, что уже превратилась в свой собственный жанр. И это проблема. Проблема, когда тебе нужна не эпическая картина для рабочего стола, а простая, честная фотография человека в кафе. Или естественный снимок, который не будет кричать: «Меня нарисовал искусственный интеллект!».

Именно с этими мыслями я наткнулся на Higgsfield SOUL. Очередной «Midjourney»? Я был настроен скептически. Но обещания были уж слишком заманчивыми: фокус не на фантастических мирах, а на реальных Instagram-фото и эстетике настоящей фотографии. Они замахнулись на самое сложное — на душу снимка. Я решил проверить, пустые ли это слова, и погрузился в тесты.

Интерфейс, кредиты и философия визуальных стилей

Главный сайт Higgsfield — перейти. Все происходит прямо в браузере. Вход через Google-почту занял секунд десять, и вот передо мной чистый, минималистичный интерфейс. В центре — строка для промпта, а сбоку — то, что сразу отличает SOUL от всех остальных.


Это библиотека «визуальных стилей». Десятки готовых пресетов: «Снято на iPhone», «Эстетика Instagram», «Кинопленка 80-х», «Y2K», «Уличный стиль Токио». Сначала я подумал, что это просто фильтры, как в соцсетях. Но я ошибся. Это не фильтры. Это фундамент.

Идея проста: вместо того чтобы мучительно прописывать в запросе модель камеры, объектив, тип освещения и настройки пленки, ты просто выбираешь готовый стиль, который задает всю атмосферу. А дальше — описываешь сцену простыми словами. В Midjourney ты — и режиссер, и оператор, и осветитель, вынужденный жонглировать техническими параметрами. Здесь же ты остаешься только режиссером. Ты выбираешь эстетику, а SOUL берет на себя всю техническую работу. Это фундаментальное отличие, которое сильно меняет подход к созданию изображений.

Теперь о деньгах. Одна генерация в базовом качестве (Basic) стоит 1 кредит, а в высоком (High) — 2 кредита. Минимальная подписка обойдется в $9 за 150 кредитов в месяц.


Серия из 8 показательных изображений «Это из Instagram»

Хватит рассуждений. Давайте я просто покажу, что у меня получилось. Я взял восемь совершенно разных идей — от случайного уличного кадра до имитации дорогой журнальной съемки — и воплотил их в SOUL.

Вот что из этого вышло:

Первый прорыв

Моей главной целью было избавиться от ощущения постановки. Я хотел получить кадры, которые выглядят так, будто их снял на свой телефон случайный прохожий с хорошим вкусом.

Например, я не просто написал «парень на крыше». Я описал жесткий послеполуденный свет, который создает резкие, графичные тени. Описал его напряженный взгляд, текстуру ткани на рукавах его куртки и то, как небрежно он стоит. Результат — не портрет модели, а выхваченный из жизни фрагмент.

A spontaneous candid photo of a male model with sun-kissed skin and a focused, intense gaze standing casually on a rooftop with bold geometric shadows falling around him. He wears a slate-gray jacket featuring distinct textured sleeves paired with a crisp white shirt buttoned up to the collar, showcasing realistic fabric grains and subtle wrinkles. The late afternoon natural light creates soft highlights and shadows on his skin and clothing, enhancing authentic texture and natural skin details. The framing is slightly tilted and off-center, capturing a genuine, relaxed posture typical of iPhone photography. The overall mood conveys raw, effortless style with natural urban architectural elements in the background, emphasizing an authentic and intimate atmosphere.


Или вот еще один кадр. Девушка в кафе в Капри. Я намеренно добавил в промпт детали, которые ломают «идеальную» картинку: яркий, почти неоновый лак на ногтях, который контрастирует с пастельным окружением. Я попросил ракурс, типичный для снимка, сделанного компаньоном через стол. И SOUL это понял. Он не стал делать глянцевую открытку, а создал живую сцену.

Basked in the soft late-morning glow of Capri’s gentle sun, a striking woman settles at a small table outside a pastel-blue bistro, its colors melting into the warm Mediterranean air. Her hair is sleekly pinned back, and her oversized, retro tortoiseshell sunglasses shield soft, thoughtful eyes. She wears a lightweight white blouse with subtle embroidery, sleeves relaxed over slender arms, nails painted a vibrant neon yellow that catch fleeting reflections of the sky. She lifts a fork elegantly twirled with glossy strands of fettuccine, coated in a silky lemon-cream sauce that gleams under the sunlight. The precise, fluid motion pauses just before her mouth, lips parted into a measured, serene gesture that holds a quiet poise. A delicate droplet of sauce clings briefly to her chin, adding an authentic undertone to the composed scene... Captured from a slightly tilted, casual angle as if by a nearby companion... perfectly resembling a candid iPhone photo.


А чего стоит это селфи? Я специально попросил ультраширокий угол, как на современных смартфонах, который искажает пропорции и создает этот узнаваемый, немного дерзкий эффект. Я описал не только одежду, но и фон — потертую стену с граффити, — чтобы добавить кадру контекста и уличной аутентичности.

An ultra-wide angle spontaneous selfie captured from a distinctly exaggerated, elevated overhead viewpoint typical of iPhone photography. The young woman engages the camera directly with a playful, neutral expression, her oversized head and expressive upper body prominently exaggerated by the wide-angle distortion. She sports an original casual outfit... on a bustling urban sidewalk near a colorful graffiti wall... The framing mimics a one-hand held selfie, showcasing her extended arm slightly foreshortened by the wide-angle lens, adding dynamic casualness.


Шаг в сторону глянца: можно ли подделать эдиториал?

Но SOUL может не только в случайные кадры. Я решил проверить, сможет ли он имитировать эстетику дорогой, продуманной фотосъемки.

Я захотел получить кадр в духе старых журналов, с настроением классической Европы. В промпте я указал не только одежду — бежевый тренч и шелковый платок, — но и попросил добавить эффект «выцветшей пленки Kodachrome» и легкое аналоговое зерно. Результат — изображение, которое сложно отличить от снимка на 35-мм пленку где-то в конце 70-х.

In the soft afternoon light diffused through tall, aged mullioned windows, a composed woman stands with effortless grace on the stone terrace of an ancestral estate... Draped in a finely woven camel-colored wool trench coat, partially revealing a silk scarf richly patterned in Hermès signature tones... The subdued warmth of fading Kodachrome tones bathes the scene... A subtle hint of 35 mm analog grain imbues the image with tactile authenticity... evoking timeless elegance in the manner of Slim Aarons’ illustrious portraits. —late-70s / early-80s cinematic photograph, authentic film grain.


Другой эксперимент — сцена идеального утра. Девушка в шелковой пижаме за накрытым столом. Здесь я делал ставку на детали: описал мягкий свет из окна, складки на белоснежной скатерти, блеск столовых приборов и то, как идеально нарезано манго на тарелке. Это уже не случайный снимок, а тщательно выстроенная композиция, которая передает ощущение тихой роскоши и спокойствия.

She lounges in deep navy silk pajamas trimmed with crisp white piping... at a round table cloaked in pristine white linen. Her fingers glide over a perfectly plated mango segment... as morning light spills gently from an unseen left window... A woven metal basket brims with flaky croissants... a black coffee steaming faintly... each creased fold, flake crumb, and gleaming porcelain rim whispers unspoken restraint and deliberate ease. Slight hand tremor and cozy grain impart inviting warmth to this solitary morning ritual.


Красота несовершенства и характера

И наконец, я решил пойти на самые смелые эксперименты. Можно ли заставить ИИ сгенерировать что-то намеренно «грязное», неидеальное, но от этого еще более настоящее?

Я описал сцену: девушка в кожаном плаще сидит на полу в не самом чистом общественном туалете, прислонившись к зеркалу. И ключевая деталь — я попросил сделать ее лицо пиксельным, размытым, как будто личность скрыта намеренно. Я добавил в промпт «жесткий свет вспышки», который создает резкие блики и подчеркивает несовершенство окружения.

Casual candid shot of a young woman with long black hair wearing a leather trench coat, sitting relaxed against a mirror on the grimy floor of a public bathroom. Her face is deliberately pixelated to preserve anonymity and create a sense of intrigue. Harsh flash lighting reflects subtly in the blurred facial area and on the surrounding mirror... Textures of the leather coat, gritty floor, and individual hair strands are clearly visible, emphasizing tactile realism.


Или эта ночная сцена у фудтрака. Две подруги едят начос. Весь промпт был построен вокруг света — «тусклый янтарный свет уличного фонаря», «неоновый пульс вывески». Я описал не глянцевых моделей, а девушек с «слегка размазанным макияжем» и «небрежным шиком». Это история не про еду, а про конец долгой ночи, про усталость и дружбу.

Beneath the dim amber haze of a lingering streetlight, two best friends lean close, illuminated by the neon pulse of a lively food truck. Their sleek hair, slightly tousled from the night, frames faces marked by the soft smudge of midnight eyeliner... One friend lifts a crisp tortilla chip... Their expressions hold steady, eyes half-lidded yet serene... The crunch seems almost audible in the stillness, contrasting with the sleepiness in their shared gaze... Captured from a low, arm’s-length angle that tilts slightly off-center, the composition feels intimate and spontaneous.


И последний, мой любимый. Девушка, которая показывает в камеру одновременно свой телефон с экспрессивным селфи и солнечные очки. Это сложная, многослойная композиция. Широкий угол, искажающий перспективу, детали маникюра, рисунок кота на двери — все эти мелочи, описанные в промпте, сложились в невероятно динамичный и живой кадр, полный иронии и характера.

The image shows a young woman sitting on a stone step... She holds a smartphone in one hand, displaying an exaggerated expressive selfie of herself on the screen, and in her other hand a pair of brown sunglasses are stretched towards the camera... The photo is taken at eye level with a wide-angle lens, creating a slightly distorted perspective that emphasizes the objects and hands in the foreground... The overall composition uses depth of field and presents a dynamic, engaging street-style portrait with a candid atmosphere.


Теперь вы поняли, что я подразумевал под душой и реалистичностью? Подумали бы вы, что это ИИ, если бы увидели эти кадры в ленте Instagram?

Так что же, Midjourney или SOUL? Неправильный вопрос

После нескольких дней тестов я понял, что ставить эти два инструмента друг против друга — это как спрашивать, что лучше: телескоп или микроскоп? Оба показывают то, что невидимо глазу, но делают это в совершенно разных масштабах и для совершенно разных целей. Сравнивать их в лоб — значит не понимать философию ни одного из них.

Midjourney — это инструмент для путешествий в подсознание. Это генератор снов. Ты даешь ему смутный образ, идею, обрывок фразы, и он выплескивает на холст нечто, что превосходит твое воображение. Результат может быть гениальным, может быть чудовищным, но он почти всегда будет нереальным. Он несет в себе ту самую эфирную, зыбкую природу сна, даже когда пытается имитировать реальность. Это его сила и его проклятие.

Higgsfield Soul работает по совершенно иному принципу. Это не генератор снов, это генератор воспоминаний. Даже если сцена, которую вы создаете, никогда не происходила, SOUL пытается убедить вас в обратном. Он обращается не к вашему подсознанию, а к вашей визуальной памяти. Он знает, как падает свет из окна в семь утра, как выглядит кожа человека после дня на пляже, как бликует мокрый асфальт под светом фонарей. Он не выдумывает новые миры, он с невероятной дотошностью воссоздает наш.

Именно поэтому изменился мой рабочий процесс.

Когда мне нужно придумать обложку для фантастического романа или увидеть, как будет выглядеть биомеханический самурай, медитирующий в неоновом саду, — я без колебаний иду в Midjourney. Я иду туда за дозой чистого, нефильтрованного креатива, за «вау-эффектом».

Но когда мне нужна фотография для статьи о кофе, и я хочу почти почувствовать его горький аромат; когда мне нужен портрет человека, в глазах которого читается история, а не пустой рендер; когда мне нужно изображение, которое вызывает не удивление, а узнавание и эмпатию, — мой выбор теперь очевиден. Я иду в SOUL.

Главное достижение SOUL — это не просто фотореализм. Это преодоление того самого барьера, той «зловещей долины», которая отделяет цифровую картинку от живого кадра. Его изображения не просто выглядят настоящими, они ощущаются настоящими.

И в этом вся суть. SOUL не пытается заменить вашу фантазию. Он пытается вернуть душу вашим фотографиям. И, честно говоря, у него это чертовски хорошо получается.

А если вы хотите разобраться, как работать и с другими инструментами ИИ для создания крутого контента с нуля, советую курс «Мастер искусственного интеллекта».

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.