Бывает, нужно озвучить видео, а времени на запись звука нет. Можно использовать нейросеть для обработки голоса: за пару секунд ИИ озвучит написанный текст. Рассказываю, в каких сервисах можно озвучить текст и где самый интересный набор голосов.
Сервисы озвучки текста голосом онлайн
Все сервисы на основе ИИ работают одинаково. Для озвучки нужно написать текст, выставить настройки и сгенерировать аудиозапись. После этого искусственный интеллект создаёт аудио.
Любая нейросеть говорит голосом почти так же как живой человек. Разница у сервисов только в инструментах на бесплатном тарифе и вариантах настроек.
Технология озвучивания текста есть у Microsoft — Vall-E, и других известных компаний. Они хорошо справляются с английским текстом, но я протестирую и те, которые генерируют русскую речь.
1. Voicemaker
Сайт: https://voicemaker.in/
Количество голосов: 14
Результат: запись
Стоимость: от 5 $
Voicemaker — самый настраиваемый сервис, генерирующий голос. Для работы нужно зарегистрироваться или войти в Google аккаунт. На бесплатном тарифе можно озвучивать небольшие фразы длинной 250 символов. На платных тарифах — от 3000 до 10 000 символов. Ещё на бесплатном тарифе, нужно упоминать нейросеть, если добавляете аудио в ролик на YouTube
Принцип работы
Нужно написать текст → выбрать дополнительные настройки: паузы, темп, акцент → указать язык → настроить звук и голос: скорость, громкость, тональность → добавить эффекты: эмоции, шепот, крик.
Здесь есть очень тонкие настройки, например, в тексте можно выделить дату или время и указать на это искусственному интеллекту. Так он точнее озвучит фразу.
Здесь максимально простые настройки.
Даже на бесплатном тарифе можно скачать аудиофайл. ИИ хорошо озвучивает даже русский текст: не коверкает слова, правильно расставляет ударения. А вот как звучит голос с разными настройками.
Мне кажется, озвучка с акцентом звучит даже лучше. Акцента нет, но нейросеть улучшает голос: он более мягкий и плавный. В аудио с паузами я добавила 2 паузы перед словом «это». Получается немного рвано, но для ИИ это всё равно круто. Эффекты вроде эмоций или шёпота не пробовала, они доступны на платном тарифе.
Преимущества и недостатки
➕Много вариантов голосов
➕Разнообразные настройки
➕Хорошо озвучивает русский текст
➖На бесплатном тарифе мало символов
2. VoxWorker
Сайт: https://voxworker.com/ru
Количество голосов: 16
Результат: запись
Стоимость: от 100 ₽
В сервисе VoxWorker можно сгенерировать запись голоса и скачать ее даже без регистрации. На бесплатном тарифе пользователю доступно 10 000 символов в сутки. Размер одного текста — до 5000 символов. На платном тарифе объем одного текста увеличивается до 10 000 символов и общее количество символов не ограничено.
Принцип работы
У VoxWorker настройки ещё проще, чем у Voicemaker. Их здесь всего 5: голос озвучки, темп, высота голоса, паузы и ударения.
ИИ поддаётся обучению. Ударение можно добавить с помощью кнопки или поставить перед ударной гласной значок плюс. Например, «вор+онка».
Нейросеть озвучивает текст голосом без ошибок, только голос на записи слишком напряжённый. Возможно, дело в дикторе Анне? Попробуем другие голоса.
Елена оказалась не менее напряжённой, чем Анна. Голос Олега с замедлением тоже не помог — все дикторы этого сервиса явно не рады своей работе. Возможно, премиальные голоса звучат лучше, но они доступны только на платных тарифах.
Преимущества и недостатки
➕Просто работать, даже не нужна регистрация
➕Хорошо озвучивает русский текст
➕10 000 символов в день на бесплатном тарифе
➖Голоса немножко уставшие, как будто давно не были в отпуске
3. ZVUKOGRAM
Сайт: https://zvukogram.com/speech/
Количество голосов: 51
Результат: запись
Стоимость: от 150 ₽
ZVUKOGRAM — сервис помогает озвучить не только обычный текст, но и диалоги. У каждого пользователя на балансе 5 токенов, которые можно потратить на озвучку. После регистрации пользователь получает ещё 10 токенов. 1 токен — 1000 знаков текста, озвученного обычным голосом. Премиум голоса стоят чуть дороже.
Принцип работы
Выбираем голоса, настраиваем интонации, паузы, скорость → сервис озвучивает текст.
Для ударения можно добавить значок плюса, а для пауз вот такой набор символов -. Маленькое тире и точку. Ещё можно настроить ритмичность текста с помощью кнопок.
Здесь удобно озвучивать диалоги. Когда выбираешь голос, можно послушать, как звучат разные варианты. Но скорее всего, будет небольшое различие — на демонстрационной записи голоса звучат чуть лучше. Вот примеры нескольких диалогов, озвученных с помощью ZVUKOGRAM.
Эрмил и Даниил звучат реалистичнее всего, их голоса похожи на человеческие. У Алёны, Дарьи и Александра — чуть больше похожи на роботов. Сравнить звучание всех голосов можно здесь.
Преимущества и недостатки
➕Хорошо озвучивает русский текст
➕Можно озвучить диалоги
➕Простые настройки
4. texttospeech.ru
Сайт: https://texttospeech.ru/
Количество голосов: 62
Результат: запись
Стоимость: от 1 ₽ за 1000 символов
Texttospeach — это огромный выбор голосов на любой вкус. Здесь с десяток женских и мужских голосов, а ещё детские и озвучка от бота, дедушки или мишки. Если нужна не просто презентация, а озвучка для сказки, сервис идеально подходит для креативных задач. Здесь есть даже голос Ленина и Левитана.
Ограничение по символам на бесплатном тарифе — 5000 за одну озвучку. Здесь нет привычных тарифов: плата снимается за символы в зависимости от типа голоса. Есть 3 категории голосов — 1, 3 и 7 ₽ за 1000 символов.
Принцип работы
Работает так же, как три предыдущих нейросети: добавляем текст → выбираем голос → настройки.
Голоса можно прослушать тут же и подобрать идеальный вариант. Но есть премиум-голоса, которые доступны только после оплаты.
Вот пример, что можно получить на бесплатном тарифе.
Ермилов — идеальный спикер. Единственное, чего мне не хватило — пауз. Я добавила паузу через команду тире с точкой (-.) после слов «здесь есть всё». Теперь запись идеальная.
Жанна тоже справилась хорошо. А Максим-бот будто специально коверкает слова. Он же бот, ему положено. Протестировать остальные голоса не получилось: все самые интересные — платные.
Преимущества и недостатки
➕Просто работать, даже не нужна регистрация
➕Хорошо озвучивает русский текст
➕5000 символов в день доступны даже без регистрации
➖Большая часть голосов — платные
5. Uberduck.ai
Сайт: https://app.uberduck.ai/
Количество голосов: 4000+
Результат: запись
Стоимость: от 96 $
Uberduck.ai озвучивает текст голосами актёров, персонажей мультфильмов, игр. Но работает только с английским текстом. Ещё это нейросеть, изменяющая голос: можно загрузить или записать аудио → ИИ обработает и выдаст запись с голосом нужного персонажа. Для работы нужно зарегистрироваться или войти в аккаунт Google.
Принцип работы
В Uberduck.ai нужно написать текст → выбрать категорию: актёры, определённый фильм, игру или мультик → выбрать конкретного персонажа или актёра. Других настроек здесь нет.
Сервис сгенерирует аудио, дальше его можно скачать.
Если написать текст на русском языке, ИИ переведёт его на английский и озвучит. Вот пример, насколько хорошо, он справляется.
Ещё эта нейросеть для изменения голоса, так как сюда можно загрузить аудио, которое сервис озвучит голосом известной личности. Русский язык тут тоже не работает, а вот с английским сервис хорошо справляется.
Преимущества и недостатки
➕ Голоса персонажей действительно похожи
➖ Нужен VPN
➖ Нет русского языка
6. SaluteSpeech
Сайт: https://developers.sber.ru/portal/products/smartspeech
Количество голосов: 7
Результат: запись
Стоимость: от 600 ₽ в месяц
SaluteSpeech — сервис Сбера. Он умеет синтезировать и распознавать речь. На бесплатном тарифе пользователю доступны 200 000 символов в месяц. Миллион символов стоит 186 ₽, но минимальная стоимость в месяц — 600 ₽. В тарифах тут сложно разобраться.
Принцип работы
В SaluteSpeech вообще нет настроек. Здесь нужно только написать текст и выбрать голос. В пробной версии — 200 символов для одной попытки.
Минимум функций и максимально простой интерфейс. Есть неудобный момент: когда выбираешь другой голос, текст нужно писать заново.
Результат работы хороший, но не самый лучший.
Александра хорошо прочитала текст, но немного не справилась с ударением. Передаём микрофон Сергею и немного меняем текст. Я добавила в слово «система» ударную букву «á», поставила паузу после «здесь есть всё», а ещё «CRM» заменила на «сиэрэм». Аудио стало звучать лучше.
Хотела записать озвучку от Kira, но она, видимо, специализируется на английском языке: получилась пустая запись. Поэтому последняя попытка — озвучка от Марфы. Она мне понравилась больше всего. Напористая.
Преимущества и недостатки
➕ Хорошо озвучивает русский текст
➕ Доступно 200 000 символов в месяц бесплатно
➖ Мало настроек, паузы и ударения можно добавить, а изменить скорость — нет
Подытожим
Я протестировала возможности ИИ и вот несколько комментариев о каждом сервисе.
- Voicemaker — больше всего настроек и очень приятная речь
- VoxWorker — доступные цены и много бесплатных символов, но слегка уставшие голоса
- ZVUKOGRAM — хороший сервис для озвучивания диалогов. Приятные голоса, нет ошибок в ударениях
- Texttospeech — самое большое разнообразие голосов: детские, взрослые, мишка, дед мороз, бот, сиплый голос, бабушка и дедушка, Ленин и Левитан
- Uberduck.ai — нейросеть озвучивает текст голосом выбранного актёра или персонажа из фильма, сериала, игры. Может трансформировать не только текст, но и аудиозапись. Но работает только на английском языке
- SaluteSpeech — озвучивает текст и распознаёт речь. Здесь меньше всего настроек и голосов, но сервис хорошо справляется с задачей