Google официально представил Veo 3.1, новую версию своей нейросетевой модели для генерации видео. Модель встроена в видеоредактор Flow, а также доступна через приложение Gemini, Gemini API и платформу Vertex AI. Google делает ставку на более глубокий и тонкий контроль при создании роликов с помощью гугл ии видео.
Благодаря нейросети от Гугл для генерации видео теперь можно не просто «сгенерировать видео», но править его детали — свет, тени, звуковой ряд, вставлять и удалять объекты. Разбираемся, что нового, как это работает, где может применяться и какие ограничения.
Что нового в Veo 3.1 по сравнению с Veo 3
Veo 3 запускался с поддержкой аудио, генерацией видеоклипов на основе текста или изображений. Но пользователи просили больше контроля, глубины редактирования, возможности вмешаться в произведённое видео. Veo 3.1 отвечает на эти запросы.
Презентация Veo 3.1
Что новенького в Veo 3.1:
Аудио во всех режимах. Теперь все видео дополняются звуковым сопровождением по запросу пользователя.
Гранулярное редактирование. В Flow добавлены инструменты, позволяющие вставлять объекты в уже сгенерированное видео (Insert) и удалять их (Remove), а также править освещение и тени, чтобы объект естественно вписывался в сцену.
Улучшенное соответствие промптов. Модель стала лучше понимать то, что вы описываете, и точнее реализовывать задуманное.
Увеличенная длительность и связность сцен. Veo 3.1 поддерживает режим расширения сцены (Extend) — генерацию продолжения от последнего кадра, создавая естественный переход и музыкальное сопровождение.
Интеграция с экосистемой Google: Модель встроена в видеоредактор Flow, а также доступна через приложение Gemini, Gemini API и платформу Vertex AI.
Сохранение и развитие преимуществ Veo 3: физическая реалистичность, мультиформат (текст-видео, изображение-видео, текст+аудио-видео) и поддержка сложных сцен.
Таким образом, Veo 3.1 — не просто апгрейд: это шаг к тому, чтобы нейросеть Google для создания видео стала инструментом не просто генерации, но полноценной сценарной и режиссёрской работы.
Как работает Veo 3.1
Чтобы не превращать статью в технический монолог, опишем ключевые компоненты и схемы работы Veo 3.1 в практическом ключе:
1. Вход: текст, изображения, кадры
Veo 3.1 научили создавать видео на основе разных вводных данных, например:
- текстового промпта
- нескольких референсных изображений, до трёх, которые задают стиль, персонажей, объекты (режим Ingredients to Video)
- начального и конечного кадра (First & Last Frame) — система интерполирует переходы между ними, добавляя движение, эффекты, звук
- видео-клипа (для режима Extend) — берутся последние кадры, и система продолжает сцену, создавая её дальнейшее развитие
Пример, как Veo 3.1 генерирует видео на основе первого и последнего кадра.
2. Генерация и рендеринг
Модель запускает внутренние слои: визуальное ядро + аудио ядро, которые работают согласованно. Veo 3.1 объединяет визуальные эффекты, физику объектов, светотени, движение камеры, синхронизацию звука.
В режиме редактирования Flow вы можете:
- Вставить объект (Insert): задать, что и куда добавить, и система автоматически рассчитает, как объект должен отбрасывать тени, взаимодействовать с окружением.
- Удалить объект (Remove): система попытается реструктурировать фон так, будто объекта никогда не было.
- Правка света/теней — управление источниками света, направление, интенсивность
3. Вывод: видео + аудио
Результатом работы становится видеоряд, длительностью д 8 секунд с нативным звуковым сопровождением: музыка, эффектный фон, голоса, окружающие шумы. Слухи о 30-секундных и минутных видео пока не подтвердились.
Veo 3.1 поддерживает разрешения 720p и 1080p для своих видеовыходов. Если вы используете Gemini API, можно управлять моделью программно: отправлять промпт, ждать завершения, загружать результат.
4. Контроль качества и безопасность
Google отмечает, что видео, созданные с помощью Veo, будут маркироваться через SynthID — цифровым водяным знаком, чтобы отличать ИИ-сгенерированный контент. Также применяются механизмы фильтрации и проверки — чтобы не генерировать контент, нарушающий политику (авторское право, контент с вредом и др.).
Но важно помнить: долгие или сложные сцены, диалоги, очень короткие фразы — всё это пока зона активной доработки. Veo 3.1 улучшился, но не идеален.
Пример сгенерированного видео в Veo 3.1
Почему это интересно для бизнеса и маркетинга
Контент-маркетинг нового уровня. С помощью гугл нейросеть видео можно генерировать тизеры, анимационные вставки, видео-обзоры товаров практически «на лету». Это даёт скорость и снижает затраты на съёмочные площадки.
Тестирование гипотез. Не нужно ждать операторов — можно быстро генерировать визуальные варианты, проверять, что «цепляет» аудиторию, и сразу корректировать.
Интеграция с API и автоматизация. Через Gemini API или Vertex AI можно встроить Veo 3.1 в свои рабочие процессы и адаптировать под разные каналы коммуникации с аудиторией.
Дополнительные возможности. Вставка/удаление объектов позволяет адаптировать уже сгенерированное видео под конкретную задачу, не генерируя всё заново. А расширение сцен позволяет продлить ролик без потери визуального контекста.
Пример генерации видео новой нейросетью от Гугл с помощь функции Ingredients to video — создание видео на основе изображений.
Ограничения, вызовы и риски
❌ Длительность. Хотя Veo 3.1 предлагает расширение сцены, его основная продолжительность — короткие ролики (пока до 8 секунд) в режиме стандартных запросов.
❌ Качество речи и звука. Особенно при коротких фразах синхронизация может быть нестабильна.
❌ Ресурсы и стоимость. Высококачественная генерация требует значительных вычислительных мощностей и будет сопровождаться расходами (в API режиме).
❌ Этические и правовые вопросы. Маркировка через SynthID — шаг в направлении прозрачности, но возможности создания дипфейков и нарушения прав остаются зоной риска. Нужно аккуратно подходить к сценам с людьми, брендами, авторским контентом.
❌ Ограничения креативной свободы. Хотя модель стала более гибкой, в сложных художественных сценах, например, когда много персонажей, всё ещё могут появляться артефакты или несоответствия.
Сравнение: Veo 3.1 в контексте других систем
На рынке сейчас растёт конкуренция — модели вроде Sora 2 от OpenAI, другие видео-ИИ. Но у Veo 3.1 — новой нейросети от Гугл для создания видео, есть свои преимущества:
- тесная интеграция с экосистемой Google и API-инструментами
- сильный акцент на редактирование внутри системы, а не просто слепой генерации
- уже встроенный аудио-модуль
- маркировка и меры безопасности
В то же время, другие системы могут быть более оптимизированы под свои сценарии (например, длинный контент, специфический стиль), что будет конкурировать с Veo 3.1.
Вывод и рекомендации
- Следите за развитием Veo 3.1 и его API, уже сейчас можно тестировать прототипы видео для маркетинга.
- Не заменяйте полностью человеческий подход, особенно для сложных роликов и брендовых посланий — ИИ пока дополняет, а не заменяет.
- Контролируйте юридическую сторону: водяные знаки, заявлять об ИИ-генерации, избегать нарушений авторских прав.
- Используйте Veo 3.1 как средство ускорения контент-процессов, особенно там, где иначе стояли бы шаблоны, баннеры или упрощённые анимации.