Google выпустила Veo 3.1: как она работает

Google выпустила Veo 3.1: как она работает

373
Время чтения: 5 минут

Google официально представил Veo 3.1, новую версию своей нейросетевой модели для генерации видео. Модель встроена в видеоредактор Flow, а также доступна через приложение Gemini, Gemini API и платформу Vertex AI. Google делает ставку на более глубокий и тонкий контроль при создании роликов с помощью гугл ии видео.

Благодаря нейросети от Гугл для генерации видео теперь можно не просто «сгенерировать видео», но править его детали — свет, тени, звуковой ряд, вставлять и удалять объекты. Разбираемся, что нового, как это работает, где может применяться и какие ограничения.

OkoCRM в Telegram
Подпишитесь на наш канал. Там полезные инструменты продаж и новости команды OkoCRM.
Перейти в канал OkoCRM

Что нового в Veo 3.1 по сравнению с Veo 3

Veo 3 запускался с поддержкой аудио, генерацией видеоклипов на основе текста или изображений. Но пользователи просили больше контроля, глубины редактирования, возможности вмешаться в произведённое видео. Veo 3.1 отвечает на эти запросы.

Презентация Veo 3.1

Что новенького в Veo 3.1:

Аудио во всех режимах. Теперь все видео дополняются звуковым сопровождением по запросу пользователя.

Гранулярное редактирование. В Flow добавлены инструменты, позволяющие вставлять объекты в уже сгенерированное видео (Insert) и удалять их (Remove), а также править освещение и тени, чтобы объект естественно вписывался в сцену.

Улучшенное соответствие промптов. Модель стала лучше понимать то, что вы описываете, и точнее реализовывать задуманное.

Увеличенная длительность и связность сцен. Veo 3.1 поддерживает режим расширения сцены (Extend) — генерацию продолжения от последнего кадра, создавая естественный переход и музыкальное сопровождение.

Интеграция с экосистемой Google: Модель встроена в видеоредактор Flow, а также доступна через приложение Gemini, Gemini API и платформу Vertex AI.

Сохранение и развитие преимуществ Veo 3: физическая реалистичность, мультиформат (текст-видео, изображение-видео, текст+аудио-видео) и поддержка сложных сцен.

Таким образом, Veo 3.1 — не просто апгрейд: это шаг к тому, чтобы нейросеть Google для создания видео стала инструментом не просто генерации, но полноценной сценарной и режиссёрской работы.

Как работает Veo 3.1

Чтобы не превращать статью в технический монолог, опишем ключевые компоненты и схемы работы Veo 3.1 в практическом ключе:

1. Вход: текст, изображения, кадры

Veo 3.1 научили создавать видео на основе разных вводных данных, например:

  • текстового промпта
  • нескольких референсных изображений, до трёх, которые задают стиль, персонажей, объекты (режим Ingredients to Video)
  • начального и конечного кадра (First & Last Frame) — система интерполирует переходы между ними, добавляя движение, эффекты, звук
  • видео-клипа (для режима Extend) — берутся последние кадры, и система продолжает сцену, создавая её дальнейшее развитие

Пример, как Veo 3.1 генерирует видео на основе первого и последнего кадра.

2. Генерация и рендеринг

Модель запускает внутренние слои: визуальное ядро + аудио ядро, которые работают согласованно. Veo 3.1 объединяет визуальные эффекты, физику объектов, светотени, движение камеры, синхронизацию звука.

В режиме редактирования Flow вы можете:

  • Вставить объект (Insert): задать, что и куда добавить, и система автоматически рассчитает, как объект должен отбрасывать тени, взаимодействовать с окружением.
  • Удалить объект (Remove): система попытается реструктурировать фон так, будто объекта никогда не было.
  • Правка света/теней — управление источниками света, направление, интенсивность

3. Вывод: видео + аудио

Результатом работы становится видеоряд, длительностью д 8 секунд с нативным звуковым сопровождением: музыка, эффектный фон, голоса, окружающие шумы. Слухи о 30-секундных и минутных видео пока не подтвердились.

Veo 3.1 поддерживает разрешения 720p и 1080p для своих видеовыходов. Если вы используете Gemini API, можно управлять моделью программно: отправлять промпт, ждать завершения, загружать результат.

Нейросеть для отдела продаж
Не теряйте время на прослушивании диалогов. Используйте нейросеть для контроля качества звонков и повышения продаж. Уже доступно в OkoCRM.
Попробовать OkoCRM

4. Контроль качества и безопасность

Google отмечает, что видео, созданные с помощью Veo, будут маркироваться через SynthID — цифровым водяным знаком, чтобы отличать ИИ-сгенерированный контент. Также применяются механизмы фильтрации и проверки — чтобы не генерировать контент, нарушающий политику (авторское право, контент с вредом и др.).

Но важно помнить: долгие или сложные сцены, диалоги, очень короткие фразы — всё это пока зона активной доработки. Veo 3.1 улучшился, но не идеален.

Пример сгенерированного видео в Veo 3.1

Почему это интересно для бизнеса и маркетинга

Контент-маркетинг нового уровня. С помощью гугл нейросеть видео можно генерировать тизеры, анимационные вставки, видео-обзоры товаров практически «на лету». Это даёт скорость и снижает затраты на съёмочные площадки.

Тестирование гипотез. Не нужно ждать операторов — можно быстро генерировать визуальные варианты, проверять, что «цепляет» аудиторию, и сразу корректировать.

Интеграция с API и автоматизация. Через Gemini API или Vertex AI можно встроить Veo 3.1 в свои рабочие процессы и адаптировать под разные каналы коммуникации с аудиторией.

Дополнительные возможности. Вставка/удаление объектов позволяет адаптировать уже сгенерированное видео под конкретную задачу, не генерируя всё заново. А расширение сцен позволяет продлить ролик без потери визуального контекста.

Пример генерации видео новой нейросетью от Гугл с помощь функции Ingredients to video — создание видео на основе изображений.

Ограничения, вызовы и риски

❌ Длительность. Хотя Veo 3.1 предлагает расширение сцены, его основная продолжительность — короткие ролики (пока до 8 секунд) в режиме стандартных запросов.

❌ Качество речи и звука. Особенно при коротких фразах синхронизация может быть нестабильна.

❌ Ресурсы и стоимость. Высококачественная генерация требует значительных вычислительных мощностей и будет сопровождаться расходами (в API режиме).

❌ Этические и правовые вопросы. Маркировка через SynthID — шаг в направлении прозрачности, но возможности создания дипфейков и нарушения прав остаются зоной риска. Нужно аккуратно подходить к сценам с людьми, брендами, авторским контентом.

❌ Ограничения креативной свободы. Хотя модель стала более гибкой, в сложных художественных сценах, например, когда много персонажей, всё ещё могут появляться артефакты или несоответствия.

Сравнение: Veo 3.1 в контексте других систем

На рынке сейчас растёт конкуренция — модели вроде Sora 2 от OpenAI, другие видео-ИИ. Но у Veo 3.1 — новой нейросети от Гугл для создания видео, есть свои преимущества:

  • тесная интеграция с экосистемой Google и API-инструментами
  • сильный акцент на редактирование внутри системы, а не просто слепой генерации
  • уже встроенный аудио-модуль
  • маркировка и меры безопасности

В то же время, другие системы могут быть более оптимизированы под свои сценарии (например, длинный контент, специфический стиль), что будет конкурировать с Veo 3.1.

Вывод и рекомендации

  1. Следите за развитием Veo 3.1 и его API, уже сейчас можно тестировать прототипы видео для маркетинга.
  2. Не заменяйте полностью человеческий подход, особенно для сложных роликов и брендовых посланий — ИИ пока дополняет, а не заменяет.
  3. Контролируйте юридическую сторону: водяные знаки, заявлять об ИИ-генерации, избегать нарушений авторских прав.
  4. Используйте Veo 3.1 как средство ускорения контент-процессов, особенно там, где иначе стояли бы шаблоны, баннеры или упрощённые анимации.
Подпишитесь на Telegram OkoCRM
Новости команды OkoCRM, обновления в системе, полезные инструменты для продаж.
Перейти в канал OkoCRM
Получайте статьи почтой. Самое важное и дважды в месяц. Иногда смешно, но не сильно
Наверх
Мы используем cookie для вашего удобства. Используя сайт, вы соглашаетесь с этим. Подробнее - в политике конфиденциальности.
Я согласен