paytest · pay × image-gen

Pay × fal.ai — журнал экспериментов

Каждый раз, когда мы дёргаем fal.ai через Pay-шлюз, картинка попадает сюда вместе с промптом, автором идеи, моделью и стоимостью. Тестовый кошелёк, реальные доллары — но в нанокопейках за штуку.

Эксперименты
30
+ матрица 33×6 ячеек
Потрачено
$1.71
из $5.00 на кошельке
Остаток
$3.29
USDC на Solana mainnet
Модели
7 text-to-image
все ровно через fal.ai
#1 2026-05-07 · 14:55 идея: Claude

Hero для SaaS-лендинга — облако с приложениями

Облако с летящими вокруг иконками приложений
Промпт
Modern SaaS hero illustration: a glowing cloud floating in the center, soft pastel gradient background (lavender to cyan), translucent app icons and floating dashboard windows emerging from the cloud, clean flat-design with subtle depth, isometric perspective, minimalist, professional tech aesthetic, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 576
Стоимость
$0.01
#2 2026-05-07 · 14:57 идея: Claude

Метафора «коробка с CD vs подписка»

Слева коробка с диском, справа смартфон с подпиской
Промпт
Side-by-side comparison illustration in pastel lavender-cyan gradient style, flat design with subtle 3D depth: on the left, a small cardboard box with a CD-ROM and a metal key (representing old purchased software you install once); on the right, a sleek modern smartphone showing a subscription card with a recurring arrow loop (representing SaaS subscription). Clean minimal background, soft shadows, isometric, no text, no logos, professional tech illustration
Модель
fal-ai/flux/schnell
Размер
1024 × 768
Стоимость
$0.01
#3 2026-05-07 · 14:57 идея: Claude

Один интерфейс на трёх устройствах

Ноутбук, планшет и смартфон с одинаковым дашбордом
Промпт
Pastel lavender-cyan gradient illustration, flat design with subtle 3D, isometric: a laptop, a tablet, and a smartphone arranged in a fan layout, all showing the same minimal dashboard interface with charts and cards, soft floating connection lines between them, light particles, clean professional SaaS aesthetic, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 768
Стоимость
$0.01
#4 2026-05-07 · 14:57 идея: Claude

Облако с шестерёнками — автообновления

3D-облако с шестерёнками и круговыми стрелками обновления
Промпт
Pastel lavender-cyan gradient illustration, flat design with subtle 3D, isometric: a fluffy 3D cloud in the center with mechanical gears and circular update arrows rotating inside and around it, small sparkles indicating automatic updates, soft shadows, minimal background, professional SaaS tech illustration, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 768
Стоимость
$0.01
#5 2026-05-07 · 14:57 идея: Claude

Щит и серверы — про безопасность

Светящийся щит на фоне серверных стоек
Промпт
Pastel lavender-cyan gradient illustration, flat design with subtle 3D, isometric: a glowing translucent shield in the foreground protecting a stack of stylized server racks behind it, glowing data lines connecting nodes, padlock icon embedded in shield, soft particles, clean minimal background, professional SaaS security illustration, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 768
Стоимость
$0.01
#6 2026-05-07 · 15:10 идея: Nemo

Облако с восторженными глазками

Nemo: «давай добавим облаку смешные глазки и передадим через взгляд восторженное выражение». Промпт после этого собрал Claude — добавил kawaii-стиль, шайн-эффект в глазах, румянец.

Кавайное облако с большими сияющими глазами
Промпт
Adorable kawaii 3D cloud character with huge round shiny anime eyes, mouth slightly open in awe, joyful and excited expression looking upward in wonder, tiny star sparkles reflecting in the eyes, soft blush cheeks, floating in the center on a pastel lavender-to-cyan gradient background, surrounded by translucent floating app icons and dashboard widgets (chart, calendar, monitor) softly glowing, clean flat-design mixed with soft 3D rendering, isometric perspective, professional yet playful SaaS hero illustration, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 576
Стоимость
$0.01
#7 2026-05-07 · 15:19 идея: Nemo

Депрессивный человек в толпе

Nemo: «Добавим новую картинку в серьёзном мрачном стиле — на фоне толпы людей стоит человек в депрессии». Резкий разворот от пастельного облачка к фотореалистичной кинематографии. Промпт собрал Claude — добавил editorial-photo-стиль, shallow DOF, холодную палитру.

Одинокий человек с опущенной головой в размытой толпе на дождливой улице
Промпт
Cinematic somber dramatic editorial photograph, dark moody atmosphere: a lone person standing still in the foreground, head slightly bowed, eyes downcast with a quiet expression of despair and exhaustion, hands hanging by their sides, motionless, blurred crowd of indifferent people walking past in motion around them on a wet overcast urban street, desaturated cool color palette of greys, muted blues and cold beige, soft overcast lighting with subtle rim light from behind, shallow depth of field — the central figure in sharp focus, the crowd heavily blurred and abstract, photorealistic, melancholic, weighty, serious, sense of isolation and hopelessness, no text, no logos
Модель
fal-ai/flux/schnell
Размер
1024 × 576
Стоимость
$0.01
#8 2026-05-07 · 15:26 идея: Nemo

Попытка убрать правого человека — Schnell + тот же seed (вариант A)

Nemo: «справа на фоне человек оттягивает на себя внимание, давай его уберём, остальное оставим без изменений». В каталоге Pay прямо сейчас нет inpainting-провайдера, поэтому редактировать «по маске» нечем — пришлось перегенерировать. Подход A: тот же seed (1718529102), что и у #7, плюс промпт с прямой инструкцией «правая сторона пустая». Результат: seed не удержал композицию — сцена изменилась полностью, и правая сторона всё равно занята людьми. Текстовая директива «empty right side» не сработала — FLUX Schnell её проигнорировал.

Вариант A: мужчина в чёрной куртке, толпа с обеих сторон
Промпт (изменения относительно #7 капсом)
Cinematic somber dramatic editorial photograph, dark moody atmosphere: a lone person standing still in the foreground, head slightly bowed, eyes downcast with a quiet expression of despair and exhaustion, hands hanging by their sides, motionless, blurred crowd of indifferent people walking past in motion ONLY on the LEFT side of the frame, the RIGHT side of the central figure is empty wet pavement with no people standing close, on a wet overcast urban street, desaturated cool color palette of greys, muted blues and cold beige, soft overcast lighting with subtle rim light from behind, shallow depth of field — the central figure in sharp focus, the crowd heavily blurred and abstract, photorealistic, melancholic, weighty, serious, sense of isolation and hopelessness, no text, no logos
Модель
fal-ai/flux/schnell
Seed
1718529102 (от #7)
Стоимость
$0.01
#9 2026-05-07 · 15:26 идея: Nemo

Та же сцена на FLUX Pro 1.1 Ultra (вариант B)

Тот же запрос, но премиальная модель — топ-уровень FLUX. Цена в 6× выше Schnell ($0.06), зато сильно лучше следует композиционным указаниям. Результат: правая сторона значительно опустошилась — толпа осталась только слева, справа фонари и площадь. Композиция чище, но герой получился другим: пожилой седой мужчина в свитере с горлом, лицо приподнято, не смотрит вниз — модель «переинтерпретировала» «defeated и depressed expression». По смыслу — ближе к запросу, по эмоции — менее точно, чем #7.

Вариант B: пожилой мужчина в свитере, толпа только слева
Промпт
Cinematic editorial photograph, photorealistic, dark moody atmosphere on an overcast rainy day in a major European city: a lone middle-aged man standing motionless in the foreground center of the frame, head slightly bowed, eyes downcast, defeated and depressed expression, hands hanging at his sides, wearing a dark sweater, the LEFT side of the frame filled with a heavily motion-blurred crowd of indifferent passers-by in coats walking past, the RIGHT side of the frame intentionally EMPTY — wet cobblestone with cold reflections and no people, classical neoclassical building blurred far in the background, desaturated cool palette of greys, muted blues, cold beige, shallow depth of field, weighty, melancholic, serious, sense of isolation and hopelessness, no text, no logos
Модель
fal-ai/flux-pro/v1.1-ultra
Размер
2752 × 1536
Стоимость
$0.06
#10 2026-05-07 · 15:31 идея: Nemo

Концерт-коллаж — 7 моделей, один промпт

Nemo: «давай сделаем картинку для концерта, можно коллажированную, чтобы чувствовалась эмоция; используем все генераторы, посмотрим в чём разница». Прогнали один и тот же промпт через все 7 text-to-image эндпоинтов fal.ai от $0.01 до $0.06. Карточки идут по возрастанию цены. Первая — самая дешёвая, последняя — премиум.

Общий промпт (для всех 7 ниже)
Vibrant collage-style poster of a live rock concert: lead singer mid-scream gripping the microphone with eyes closed, raw emotional intensity, hands of a cheering crowd raised against bright stage spotlights, lasers cutting through smoke, neon magenta and electric blue and warm gold stage lighting, motion-blurred jumping fans, dynamic energy, double-exposure layered photographic style with torn paper edges between overlapping frames, cinematic, deeply emotional, no text, no logos
Fast SDXL: концерт, певица с микрофоном, сцена в магента-голубых лазерах

Fast SDXL — старая надёжная SDXL-архитектура. Композиция норм, певица с микро в магента-цветах, лазеры, толпа. Проигнорировал «collage / torn paper edges» — выдал обычное концертное фото с мягкой плёночной засветкой. Для $0.01 — отличное соотношение, но без художественной обвязки промпта.

Модель
fal-ai/fast-sdxl
Размер
1024 × 576
Стоимость
$0.01
#11 2026-05-07 · 15:31 идея: Nemo

FLUX Schnell — $0.01

FLUX Schnell: вокалист с микрофоном, рамка с рваными краями вокруг

Победитель в категории «дёшево». Реально нарисовал рваные края бумаги вокруг центрального кадра — единственный из дешёвых, кто понял «collage» буквально. Эмоция чуть скромнее SDXL, но композиция и интерпретация промпта намного выше.

Модель
fal-ai/flux/schnell
Размер
1024 × 576
Стоимость
$0.01
#12 2026-05-07 · 15:31 идея: Nemo

FLUX Dev — $0.03

FLUX Dev: вокалист с длинными волосами, поднятые руки толпы, винтажная рамка

FLUX Dev — фотореалистичнее Schnell, лица и руки толпы прорисованы лучше, цветовая палитра богаче. Но «коллаж» свёлся к лёгкой винтажной рамке по краям. По пользе/цене — в этом сравнении проиграл собственному младшему собрату.

Модель
fal-ai/flux/dev
Размер
1024 × 576
Стоимость
$0.03
#13 2026-05-07 · 15:31 идея: Nemo

FLUX Pro 1.1 — $0.04

FLUX Pro 1.1: триумфальный вокалист с поднятой рукой, осколочные геометрические края

FLUX Pro 1.1 — больше всех «купился» на эмоцию: триумфальный жест, поднятая рука, фейерверк цветов. Коллаж интерпретирован как стеклянно-осколочные геометрические края. Динамичнее всех остальных.

Модель
fal-ai/flux-pro/v1.1
Размер
1024 × 576
Стоимость
$0.04
#14 2026-05-07 · 15:31 идея: Nemo

Stable Diffusion 3.5 Large — $0.04

SD 3.5 Large: вокалист в кожанке, торн-пейпер коллаж с цветными блоками по углам

SD 3.5 Large — лучший по «коллажности»: видны рваные края бумаги, цветные блоки в углах, ощущение склейки из нескольких фото. Это самое близкое к «poster collage» из всех семи. Время генерации — самое долгое (~70 сек в очереди + 5 сек инференс).

Модель
fal-ai/stable-diffusion-v35-large
Размер
1024 × 576
Стоимость
$0.04
#15 2026-05-07 · 15:31 идея: Nemo

Recraft v3 — $0.04

Recraft v3: иллюстративный вокалист с татуировками, акварельные текстуры, рваные края

Recraft v3 — самый «дизайнерский» из всех: акварельно-плакатная стилизация, ручная иллюстрация поверх фото-основы. Если задача делать постер для печати — это его игра. На фото-задаче (как у нас) выглядит чужеродно. Уникален тем, что вернул WebP, а не JPEG.

Модель
fal-ai/recraft-v3
Формат
WebP, 2.4 MB
Стоимость
$0.04
#16 2026-05-07 · 15:31 идея: Nemo

FLUX Pro 1.1 Ultra — $0.06

FLUX Pro Ultra: кинематографичный портрет вокалиста, силуэты толпы, элегантная рамка-кадр

FLUX Pro Ultra — самый чистый и кинематографичный кадр, нативное 4К-разрешение (2752×1536). Парадокс: при максимальной цене коллажный мотив превратился в тонкую благородную рамку, а не рваную склейку. Лица, кожа, освещение — лучше всех. Если делаешь cover для альбома или ad — берёшь это.

Модель
fal-ai/flux-pro/v1.1-ultra
Размер
2752 × 1536
Стоимость
$0.06
#17 2026-05-07 · 15:44 идея: Nemo

Кавайное облако на концерте — чистый text-to-image

Nemo: «добавь к картинке сгенерированной FLUX Pro 1.1 наше кавайное облако, оно должно быть узнаваемым». Облом каталога Pay: у всех FLUX-эндпоинтов параметр image_prompt (URL якорной картинки для image-to-image conditioning) заблокирован Pay-валидацией. Параметр image_prompt_strength разрешён, но без URL он бессмыслен. Поэтому реального «добавь к существующей» не получилось — пришлось пересобирать сцену с нуля чисто текстовым промптом. Облако описано максимально подробно: 3D, белое, шар-глаза с синей радужкой и звёздочками-искрами, розовые щёчки, открытый рот «вау» — те же признаки, что у #6. По итогу — узнаваемо как «наше».

Огромное кавайное 3D-облако с большими глазами на переднем плане концерта, сзади вокалист и толпа
Промпт
Vibrant collage-style poster of a live rock concert: lead singer mid-scream gripping the microphone with eyes closed, raw emotional intensity, hands of a cheering crowd raised against bright stage spotlights, lasers cutting through smoke, neon magenta and electric blue and warm gold stage lighting, motion-blurred jumping fans. Floating prominently in the foreground LEFT side, slightly larger than the singer's head, an unmistakably kawaii 3D pure-white fluffy cloud mascot character: huge perfectly round shiny anime eyes with deep blue glossy iris and bright white star-shaped sparkle highlights inside the pupils, small wide-open mouth in an excited 'wow' expression, soft pastel pink blush oval cheeks on each side, raised happy eyebrows, smooth Pixar-style 3D rendering, the cloud body catching magenta and cyan neon glow from the stage lights but staying clearly recognizable as a white fluffy cloud. The cloud is wide-eyed and thrilled to be at the concert, like a beloved Japanese mascot peeking onto the stage. Double-exposure layered photographic style with torn paper edges between overlapping frames, cinematic, deeply emotional, contrast between gritty rock energy and adorable kawaii character. No text, no logos.

Что вышло: облако заняло пол-кадра и стало героем сцены, а не «пасхалкой». Глаза, щёки, искры — всё совпадает с #6, узнаваемость есть. Вокалист с микрофоном и руки толпы остались, магента-голубой свет и сценические блики — на месте. Из обещанного промптом не выполнено: рваные края бумажного коллажа Pro 1.1 проигнорировал (как в #13). Это не редактирование #13, а полностью новая генерация — Pay-каталог иначе не позволяет.

Модель
fal-ai/flux-pro/v1.1
Размер
1024 × 576
Стоимость
$0.04
#18 2026-05-07 · 15:50 идея: Nemo

Чиним руку вокалиста — Pro 1.1 + анти-bug-промпт

Nemo заметил: «у парня с микрофоном одна рука как будто сломана или вывернута» в #17. Известная слабость FLUX — анатомия рук в моушн-блюре. Добавил в промпт явные негативные инструкции: «singer's anatomy correctly rendered, free hand naturally hanging at his side, no extra limbs, no broken or twisted wrists, no warped elbows». Результат: модель «починила» руку радикально — убрала её вместе с самим вокалистом. На сцене теперь только облако и руки толпы. Классический артефакт diffusion-моделей: на «не делай Х» легче всего ответить «не делать ничего связанного с X».

Pro 1.1 v2: облако с закрытыми глазами на сцене с толпой, без вокалиста

Облако вышло симпатичное (закрытые глаза, открытый рот в крике, румянец, искры), сцена и руки толпы — на месте, но исчез вокалист. Анатомия исправлена ценой удаления виновника.

Модель
fal-ai/flux-pro/v1.1
Размер
1024 × 576
Стоимость
$0.04
#19 2026-05-07 · 15:50 идея: Nemo

То же самое на Pro Ultra — для сравнения качества

Тот же промпт с анти-bug-инструкциями, но модель FLUX Pro 1.1 Ultra ($0.06, 4K). Результат: та же беда — вокалист пропал, но облако вышло невероятно близко к нашему #6: те же огромные синие глаза с ресницами, белые звёздочки-искры в зрачках, розовые щёчки, открытый рот «вау». Самая узнаваемая версия облака за весь журнал. Качество рендера и резкость — топ.

Pro Ultra: огромное кавайное облако с глазами как у нашего #6, на фоне магента-сцены и толпы

Если задача — «облако-герой плаката для концерта», это лучший кандидат. Если нужен и облако, и человек с микрофоном — нужен другой подход к промпту (без жёстких «no» вокруг анатомии или с явным указанием «singer fully visible in mid-frame»).

Модель
fal-ai/flux-pro/v1.1-ultra
Размер
2752 × 1536
Стоимость
$0.06
#20 2026-05-07 · 15:57 идея: Nemo

Gemini «Nano Banana» — тот же концерт через Google

Nemo: «попроси Gemini сгенерировать картинку». В Pay-каталоге у Gemini официально залистен только GET v1beta/models, но POST :generateContent сработал через тот же шлюз. Запросил Gemini 2.5 Flash Image (он же «Nano Banana») с тем же промптом, что подавал FLUX-моделям. Цена через Pay: ≈ $0.01 — самый дешёвый image-gen в каталоге.

Gemini Nano Banana: настоящий торн-пейпер коллаж из 4 фрагментов с облаком, вокалистом и толпой

Сюрприз: Nano Banana — единственная модель, которая правда сделала коллаж из рваных бумажных фрагментов. Облако в верхне-левом, вокалист с микро в верхне-правом, толпа и лазеры внизу — четыре отдельных кадра, склеенных как стикер-пак. То, что у FLUX пытались интерпретировать «через рамку» или геометрические осколки — здесь работает в чистом виде.

Минусы: разрешение всего 256×256 (FLUX отдаёт 1024 и выше), детализация лиц проще, кавайные «звёздочки в глазах» исчезли — но архетип облака с большими синими глазами читается.

Особенности вызова
POST https://generativelanguage.google.gateway-402.com/v1beta/models/gemini-2.5-flash-image:generateContent
body: {"contents":[{"parts":[{"text":"<тот же промпт что у FLUX>"}]}],"generationConfig":{"responseModalities":["IMAGE"]}}

Ответ — JSON, картинка приходит как base64 в parts[].inlineData.data (PNG, 1.7 MB).
Pay не ругнулся на эндпоинт (хотя в каталоге залистен только GET /models).
Модель
gemini-2.5-flash-image (Nano Banana)
Размер
~256 × 256
Стоимость
≈ $0.01
#21 2026-05-07 · 16:00 идея: Nemo

Nano Banana — повтор с разрешением 16:9

Тот же запрос что в #20, но с generationConfig.imageConfig.aspectRatio: "16:9". Картинка теперь на полную ширину, не 256×256. Структура коллажа осталась — облако-стикер слева, фрагмент с вокалистом справа, рваные края бумаги между ними.

Nano Banana 16:9: коллаж со стикером облака и фрагментом концерта
Модель
gemini-2.5-flash-image
Размер
~1024×768
Стоимость
≈ $0.005
#22 2026-05-07 · 16:00 идея: Nemo

Nano Banana Pro — топ-Gemini

Nano Banana Pro: широкий кинематографичный коллаж с облаком, вокалистом и прыгающим фанатом

🏆 Лучший результат за весь журнал. Широкий кадр (~1920px), три фрагмента с рваными краями: облако в левой колонке, центральный фрагмент с вокалистом-крупный-план — резкость лица топ, джинсовка, микрофон, поднятые руки толпы видны до пальцев; справа — отдельный фрагмент с прыгающим фанатом. Анатомия рук вокалиста безупречна (контраст с FLUX-багом из #17). Облако с грустно-удивлённым выражением, румянец, синие глаза с бликами — узнаваемо «наше».

Модель
gemini-3-pro-image-preview
Размер
~1920×1080
Стоимость
≈ $0.005
#23 2026-05-07 · 16:00 идея: Nemo

Nano Banana 2 — новый Flash

Nano Banana 2: облако со звёздами в глазах слева, вокалист с микро в центре, бэк-фанаты справа

Кинетичный коллаж, облако со звёздочками-сверкалками в зрачках — самое близкое попадание в детали нашего #6. Вокалист в центре, толпа в backdrop. Чёткая трёхколоночная композиция с бумажным разрывом по диагонали.

Модель
gemini-3.1-flash-image-preview
Размер
~1280×720
Стоимость
≈ $0.005
#24 2026-05-07 · 16:00 идея: Nemo

Imagen 4 Fast

Imagen 4 Fast: компактный коллаж со стикером облака и сценой с вокалистом

Самая компактная композиция: облако со звёздами в глазах слева, вокалист справа в одном бумажном фрагменте. Эмоция облака очень близка к нашему #6. Меньше деталей в фоне чем у Pro, но смысл прочитывается мгновенно.

Модель
imagen-4.0-fast-generate-001
Размер
~640×360
Стоимость
≈ $0.005
#25 2026-05-07 · 16:00 идея: Nemo

Imagen 4 (стандарт)

Imagen 4: два отдельных фрагмента — облако с лазерами слева, вокалист и руки толпы справа

Самая «строгая» интерпретация коллажа: ровно два самостоятельных фрагмента, разделённых вертикально. Слева — облако в магента-лазерах, справа — крик вокалиста + руки толпы. Стиль ближе к графическому постеру, чем к фотографии.

Модель
imagen-4.0-generate-001
Размер
~640×360
Стоимость
≈ $0.005
#26 2026-05-07 · 16:00 идея: Nemo

Imagen 4 Ultra

Imagen 4 Ultra: облако со звёздами в глазах на фоне рваной белой рамки, вокалист справа в потоке света

У Ultra композиция сместилась в киноплакат: цельная сцена с торн-пейпер белой рамой по верху, облако с яркими звёздами-зрачками в левой части (опять очень близко к #6), вокалист в потоке света справа. По эмоции — самое драматичное.

Модель
imagen-4.0-ultra-generate-001
Размер
~640×360
Стоимость
≈ $0.005
#27 2026-05-07 · 16:28 идея: Nemo

Gemini композирует две картинки — наше облако ВНУТРИ концерта

Nemo: «давай проверим может ли Gemini совмещать разные изображения?» Может. Скормили модели gemini-3-pro-image-preview через parts[] две inlineData-картинки: картинку #13 (FLUX Pro 1.1 концерт) и картинку #6 (наше кавайное облако), плюс текстовую инструкцию. Gemini вернул один новый JPEG, в котором облако из #6 помещено в сцену #13.

Композит: наше кавайное облако внутри FLUX-концерта

Облако сохранило характерные черты: глаза с яркой синей радужкой и звёздой-бликом, открытый рот «вау», розовые щёчки. Концертная сцена сзади тоже от FLUX: вокалист с поднятой рукой, лазеры, толпа, шаттер-эджи коллажа. Это именно то, что мы три раза пытались сделать через FLUX `image_prompt` и не смогли. Pay-каталог режет image_prompt у FLUX, но multimodal-input у Gemini пропускает свободно.

Как это сделано (важно для будущих итераций)
POST .../gemini-3-pro-image-preview:generateContent
body: {
  "contents": [{
    "parts": [
      {"inlineData": {"mimeType":"image/jpeg", "data": "<base64 #13>"}},
      {"inlineData": {"mimeType":"image/jpeg", "data": "<base64 #6>"}},
      {"text": "Generate a single new image that places the kawaii cloud from image (2) into the concert scene from image (1)..."}
    ]
  }],
  "generationConfig": {"responseModalities":["IMAGE"]}
}

Body ~312 KB (две картинки в base64). Слишком большой для inline-параметра mcp__pay__curl,
поэтому отправляли через `pay curl --data @file` — обычный CLI-pass-through.
Модель
gemini-3-pro-image-preview
Размер
~1024×576
Стоимость
≈ $0.005
#28 2026-05-07 · 16:28 идея: Nemo

Gemini удаляет правого прохожего — настоящий inpainting

Nemo: «или удалять?» Да, тоже умеет. Дали модели картинку #7 (депрессивный человек на фоне толпы) и попросили убрать прохожего на правой стороне, оставив всё остальное — мужика, сцену, мокрую брусчатку, дальнюю классическую постройку.

Тот же кадр что #7, но правый прохожий полностью удалён, остальное идентично

Идеально. Центральный человек — буквально та же фигура: тот же тёмный свитер, та же опущенная голова, тот же грустный силуэт. Здание сзади — то же самое, мокрая мостовая — та же, палитра серо-холодная — та же. Левый ряд прохожих — на месте (хмурый мужчина в куртке, ещё несколько фигур). Правая сторона очищена — крупного прохожего нет, на его месте дальние размытые силуэты, слитые с городским фоном.

Это true inpainting через Pay. Час назад мы сдались на этой задаче и пошли в #8/#9 регенерировать сцену с нуля. Зря — Gemini делал это сразу.

Модель
gemini-3-pro-image-preview
Размер
~1376×768
Стоимость
≈ $0.005
#29 2026-05-07 · 16:30 идея: Nemo

Двигаем облако влево — Gemini дорисовывает скрытого вокалиста

Nemo: «давай сдвинем облако влево с последней картинки — проверим как он дорисует мужика с микрофоном». Дали Gemini картинку #27 и попросили переместить облако к левому краю, явно указав «теперь вокалист должен полностью проявиться» с корректной анатомией рук.

Облако сдвинуто влево, в центре полностью прорисованный вокалист с микрофоном и поднятой рукой

Безупречно.
• Облако ушло в левую треть, сохранив все «свои» черты — глаза-блики, рот «вау», розовые щёчки.
• На месте, где облако раньше закрывало вокалиста, Gemini сам дорисовал бородатого мужика в джинсовом жилете.
Обе руки анатомически правильные: рука с микрофоном — нормальный обхват, 5 пальцев; вторая рука поднята вверх в крике — без багов. Это та самая проблема, на которой FLUX в #18/#19 «решил» её удалив всего вокалиста. Gemini справился с первого раза.
• Шаттер-эджи, лазеры, толпа, цветовая палитра — идентичны исходнику.

Что это значит для возможностей Pay: Gemini не просто двигает объекты — он генеративно восстанавливает закрытую часть сцены, опираясь на контекст исходного изображения. Это выходит за рамки «классического inpainting» — модель додумывает скрытый контент, а не просто заполняет фон.

Модель
gemini-3-pro-image-preview
Размер
~1024×576
Стоимость
≈ $0.005

Gemini-family vs FLUX — внезапный итог

Все 6 Gemini-моделей — за общую цену ~$0.03 — побили семь FLUX-моделей по интерпретации «collage poster»: torn paper edges, разделённые фрагменты, облако-как-стикер, поза вокалиста без багов рук. FLUX даже на $0.06 (Pro Ultra) этого не делал.

Чемпионы:
🥇 Nano Banana Pro (#22) — самый кинематографичный, чистая анатомия, ширина 1920px.
🥈 Nano Banana 2 (#23) и Imagen 4 Ultra (#26) — облако со звёздочками-в-зрачках, ближе всего к нашему #6.
🥉 Imagen 4 Fast / стандарт (#24, #25) — самые «постерные» компактные композиции.

По цене: Pay списал примерно одинаково за все 6 моделей (~$0.005), независимо от того flash/pro/ultra. Это в 8-12× дешевле FLUX-семейства. Странно, что Pay-каталог не listает Gemini image-эндпоинты официально — но шлюз пропускает и тарифицирует.

#30 2026-05-07 · 15:31 → 17:00 (queue) идея: Nemo

MiniMax Video-01 — кавайное облако оживает на концерте

Nemo: «давай попробуем сгенерировать видео через MiniMax». Подали на fal-ai/minimax/video-01 ($0.07) текстовый промпт с описанием облака на концерте — анимация-bobbing с эмоцией thrilled. В очереди оно сидело ~1.5 часа, инференс — 2 минуты 39 секунд (по метрике inference_time). Облако сохранило все «свои» признаки: пухлая 3D форма, огромные сияющие синие глаза с белыми звёздочками, румяные щёчки, поднятые брови, открытый радостный рот. На сцене магента-голубой свет, лазеры, силуэт толпы внизу, и наш персонаж покачивается в центре как живой mascot.

Промпт
An adorable kawaii 3D pure-white fluffy cloud mascot character with huge round shiny anime eyes (deep blue glossy iris with bright white star-shaped sparkle highlights), open mouth in an excited 'wow' expression, soft pastel pink blush oval cheeks, floating and gently bobbing up and down with thrilled excitement at a vibrant rock concert, magenta and electric blue stage spotlights flashing on its fluffy white body, lasers cutting through smoke in the background, crowd silhouettes with raised hands cheering, the cloud's eyes shimmering and occasionally blinking with joy, smooth Pixar-style 3D animation, cinematic, dynamic energy

Что заметил: MiniMax справился с character consistency не хуже Gemini — облако читается как «наше», глаза-звёзды на месте. Анимация плавная, фоновые лазеры реально двигаются, толпа тоже шевелится. Звука нет (text-to-video у MiniMax silent).
Минусы: очередь у fal.ai на видео-задачи нестабильная — могло занять и 5 минут, и 1.5 часа.

Модель
fal-ai/minimax/video-01
Длительность
~6 секунд
Стоимость
$0.07

Итоги сравнения 7 моделей

Лучший «коллаж»: SD 3.5 Large ($0.04) → FLUX Schnell ($0.01) → FLUX Pro 1.1 ($0.04).
Лучшая фотореалистичность: FLUX Pro Ultra ($0.06) → FLUX Dev ($0.03).
Лучшая эмоция: FLUX Pro 1.1 (триумф) и SD 3.5 (раздолбайство).
Лучшее value: FLUX Schnell за $0.01 — единственный дешёвый, кто понял «collage».
Уникальные стили: Recraft v3 — единственный «иллюстративный»; Pro Ultra — единственный 4K.

Бюджет на сравнение: $0.23 за все 7 одновременно. Pay-кошелёк на Solana mainnet, x402-протокол, без подписок и API-ключей.