~/wiki / prototipy-i-handoff / google-flow-guide

Google Flow: как создать видеоролик с нуля — от промпта до экспорта

Основной чат

Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.

$ cd раздел/ $ join vibe dev
Google Flow: как создать видеоролик с нуля — от промпта до экспорта - обложка

Что нужно для старта

Flow работает на трёх моделях Google: Veo 3 отвечает за видеогенерацию, Imagen — за изображения, Gemini — за понимание текстовых инструкций.

Доступ — через подписку Google AI. Два варианта:

  • AI Pro — $19.99/месяц, базовый доступ к Flow, модели Veo 2
  • AI Ultra — $249.99/месяц, полный доступ к Veo 3 и Veo 3.1 с генерацией звука, 25 000 AI-бонусов в месяц

Бонусы (кредиты) тратятся на генерацию: одна сцена стоит от 10 до 100 кредитов в зависимости от выбранной модели и количества вариантов. Неиспользованные кредиты не переносятся на следующий месяц.

Войти: flow.google.com → кнопка New Project.


Три режима генерации

Flow предлагает три точки входа в зависимости от того, с чего начинаешь:

Text to Video — только текстовый промпт. Подходит для первых экспериментов и сцен, где не нужна привязка к конкретному визуальному референсу.

Frames to Video — задаёшь первый и/или последний кадр, Flow генерирует переход между ними. Используй, когда нужно контролировать начало и конец движения: например, крупный план лица → отъезд камеры на общий план улицы.

Ingredients to Video — загружаешь референсные изображения или видео как «ингредиенты» сцены. Flow берёт из них визуальные элементы — персонажа, объект, стиль — и встраивает в генерацию. Это основной способ сохранить консистентность персонажа между разными сценами.


Как писать промпты

Короткий промпт — главная причина плохого результата. Flow интерпретирует неопределённость буквально: написал «человек идёт» — получил силуэт в нейтральном пространстве.

Хорошо работающая структура промпта:

plaintext
[субъект + действие] + [окружение] + [движение камеры] + [освещение/атмосфера] + [стиль/качество]

Пример слабого промпта:

plaintext
девушка идёт по улице

Пример рабочего:

plaintext
молодая женщина в льняном пальто идёт по пустой мощёной улице старого города,
камера медленно следует за ней, золотой час, мягкие длинные тени,
кинематографическое качество, 24fps, атмосфера европейского городского кино

Движение камеры — отдельный параметр, который часто упускают. Flow понимает стандартные операторские термины: pan left/right (горизонтальная панорама), tilt up/down (наклон), dolly in/out (наезд/отъезд), tracking shot (следование за объектом), static shot (статичная камера).

Звук описывай прямо в промпте, если нужен (доступно на Veo 3): ambient city noise, dialogue: woman says quietly "I'll be back", soft wind, distant church bells. Модель генерирует аудио синхронно с видеорядом.


Настройки генерации

На странице промпта — четыре ключевых параметра:

  • Модель: Veo 2 Fast (дёшево, быстро, ниже качество), Veo 2 Quality (баланс), Veo 3 Highest Quality (максимум детализации и звук)
  • Количество вариантов: 1–4. Для первой итерации достаточно 2, чтобы выбрать направление
  • Соотношение сторон: 16:9 для горизонтального видео, 9:16 для вертикального (Reels/Shorts)
  • Длительность: базовая генерация — 4–8 секунд на сцену

Одна генерация на Veo 3 с двумя вариантами расходует около 60–80 кредитов.


Сборка нескольких сцен в ролик

Flow позволяет соединять сцены в единое видео прямо внутри платформы. Логика работы:

  1. Генерируй каждую сцену отдельно через New Scene в рамках одного проекта
  2. Используй Ingredients для сохранения персонажа: загрузи стоп-кадр из предыдущей сцены как референс — так модель удержит внешность и стиль
  3. Расставь сцены на таймлайне в нужном порядке
  4. При необходимости — используй Frames to Video, чтобы сгенерировать плавный переход между двумя сценами

Для расширения уже готового клипа: открой сцену → Extend → задай промпт для продолжения. Так можно довести сцену до 30–60 секунд итеративными шагами.


Flow TV: как использовать для обучения

Встроенная лента Flow TV — не просто галерея результатов. Каждое видео там идёт с полным промптом и настройками, которые его создали. Алгоритм работы с ней:

  1. Найди видео с нужным тебе визуальным языком
  2. Скопируй структуру промпта — не само описание, а его каркас: как задан субъект, какое движение камеры, какой стиль
  3. Подставь своё содержание в ту же структуру
  4. Сравни результат с оригиналом, скорректируй

Это быстрее, чем экспериментировать с нуля.


Типичные проблемы

Персонаж меняется от сцены к сцене. Решение: всегда используй Ingredients с референсным кадром из предыдущей сцены. Без этого модель генерирует каждый раз заново.

Видео выглядит как стоковый футаж, а не кино. Причина: в промпте не задано движение камеры и нет стилистических маркеров. Добавь тип движения камеры и хотя бы один визуальный референс (в стиле A24, Kubrick-like symmetry, handheld documentary feel).

Звук не совпадает с картинкой. Это ограничение Veo 3 — синхронизация речи с артикуляцией работает нестабильно. Для видео с диалогом лучше генерировать только видеоряд, а озвучку добавлять отдельно в видеоредакторе.

Кончились кредиты на середине проекта. Кредиты не переносятся, но обновляются в начале нового платёжного цикла. Считай примерно: 2 варианта на Veo 3 = ~70–80 кредитов; при лимите 25 000/месяц это около 300 сцен на Ultra.


Итог

plaintext
☐ Зарегистрирован на flow.google.com с подпиской AI Pro или AI Ultra
☐ Промпт содержит субъект, окружение, движение камеры и стиль
☐ Для персонажа-константы используется Ingredients с референсом
☐ Выбрана модель под задачу: Veo 2 Fast для черновиков, Veo 3 для финала
☐ Сцены собраны на таймлайне в рамках одного проекта
☐ Flow TV использован хотя бы один раз как источник структуры промпта
$ cd ../ ← назад к Прототипы и handoff