Бывает, надо перевести голосовое сообщение в текст — расшифровать интервью, подготовить субтитры или распечатать конспект вебинара. Набирать текст руками то еще удовольствие, поэтому придумали автоматические сервисы транскрибации. Разбираемся, где найти сервисы для перевода голоса в текст, как они работают и сколько стоят.
Но сначала мы должны напомнить про OkoCRM — систему, которая помогает компаниям продавать больше, а командам — работать быстрее.
Что такое транскрибация
Транскрибация — это перевод устной речи в текст. Обычно её делают, чтобы:
- расшифровать запись звонков, например, для карточек клиента в CRM
- перевести аудиолекцию в конспект
- расшифровать интервью, переговоры, презентации с клиентами
- подготовить субтитры для видероликов
Есть два способа, как сделать транскрибацию:
Нанять исполнителя. За вознаграждение какой-нибудь фрилансер переведет аудиозапись в печатный текст. Потом почистит словесный мусор и выполнит небольшую редактуру — поправит где надо окончания в словах, расставит знаки препинания и заглавные буквы.
Найти онлайн-сервис. Он сопоставит звуки с буквами и создаст печатный текст. Могут быть ошибки в расшифровке, зато программа перевода голоса в текст гораздо дешевле живого исполнителя.
Google Документы
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: нет
Как работает: Android, iOS, либо браузер
Google Документы — это никакой не транскрибатор, а онлайн-сервис для создания и редактирования текстовых документов. Однако с помощью встроенного «Голосового ввода» сервис можно использовать для несложной транскрибации.
Как это работает:
- Кликаете вкладку «Инструменты»
- Выбираете «Голосовой ввод»
- Нажимаете кнопку сбоку и говорите
Еще можно включить аудиофайл на колонке. Google Документы его прослушают и расшифруют.
У сервиса три недостатка:
- не распознаются знаки препинания
- нельзя загрузить файл
- если молчать 2-3 секунды, запись обрывается
Google Документы подходят для простеньких задач. Когда надо сохранить заметку, и нет времени печатать текст. Либо расшифровать длинный месседж клиента, заказчика или коллеги. Для транскрибации интервью лучше поискать что-то помощнее.
Google Keep
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: нет
Как работает: Android, iOS, либо браузер
Google Keep — сервис для создания и редактирования заметок. В мобильном приложение сервиса можно перевести речь в текст через микрофон. Работает так:
- Устанавливаете приложение
- На «Главной странице» жмете значок микрофона
- Говорите или проигрываете файл через колонку
- Аудио сохранится вместе с расшифрованным текстом
В этом приложении также нельзя загрузить файл, плюс алгоритмы не различают знаки препинания. Зато все работает бесплатно и подходит, чтобы надиктовывать заметки, или переводить короткие голосовые сообщения в текст.
Speechpad
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: да
Как работает: Android, iOS, либо браузер
Speechpad — это аудио-блокнот, а по совместительству программа для перевода голоса в текст. С помощью встроенного микрофона можно печатать текст голосом, либо загружать видео или аудиофайл и транскрибировать его.
Работает Speechpad:
- на Windows, Mac и Linux через браузер Chrome
- на Android, iOS через мобильные приложения
Чтобы загрузить аудио или видеофайл и получит расшифровку, надо:
- Нажать кнопку «Транскрибация»
- Выбрать файл или указать ссылку на файл
- Выставить дополнительный настройки
- Нажать кнопку «Включить запись»
- Готовую транскрибацию скачать на компьютер в отдельном txt-файле
Dictation
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: нет
Где работает: браузер
Dictation — это нейросеть для перевода голоса в текст. Подходит для устной диктовки. Финальный текст можно сразу отредактировать, а затем:
- отправить по почте
- сохранить отдельным файлом на компьютер
- выложить в соцсеть
У сервиса есть минус — некачественную речь он не распознает. В расшифровке будут ошибки, если на записи диктор проглатывает окончания слов, вокруг много посторонних шумов или просто микрофон был слабенький.
oTranscribe
Автотранскибация: нет
Транскрибация через микрофон: нет
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: нет
Где работает: браузер
Бесплатный онлайн-сервис без автоматической транскрибации. Загружаете аудио- или видеофайл, жмете кнопку Play и самостоятельно, вслед за речью диктора, набираете во встроенном редакторе текст. Чтобы не отставать от речи диктора, тут же, в настройках, запись можно замедлить.
oTranscribe работает с аудио и видеофайлами, а еще роликами на YouTube. Готовую транскрибацию можно отформатировать и выгрузить на компьютер.
RealSpeaker
Автотранскибация: есть
Транскрибация через микрофон: нет
Цена: 16 ₽/минута
Распознает знаки препинания: ❌
Можно загрузить файл: да
Где работает: браузер
RealSpeaker — платная онлайн программа перевода голоса в текст. Нельзя диктовать текст голосом через диктофон. Зато можно загрузить файл длительностью до 180 минут и транскрибировать его. Сразу после загрузки сервис рассчитает время и стоимость перевода по тарифу 16 рублей за каждую минуту.
Speechnotes
Автотранскибация: есть
Транскрибация через микрофон: нет
Цена: от $1,9/мес
Распознает знаки препинания: ✅
Можно загрузить файл: да
Где работает: Android, либо браузер
Speechnotes — сервис перевода голоса в текст. Бесплатно переводит речь через микрофон, если нужно транскрибировать аудиофайл — нужна подписка.
Готовые расшифровки хранятся в личном кабинете и не удаляются, можно скачать на компьютер в любой момент. Также сервис расшифровывает звук из видеофайлов, роликов на Youtube, плюс сам расставляет знаки препинания.
Telegram
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: да
Где работает: Android, iOS, либо браузер
В Телеграм есть бот, который бесплатно расшифровывает текст. Скидываете ему аудиофайл и примерно минут через 10 бот присылает расшифровку.Бот работает бесплатно, но имеет ограничения:
- воспринимает аудио длительностью не более 15 минут
- не ставит знаки препинания, не распознает заглавные буквы
- может допускать ошибки в тексте
- не расшифровывает видеофайлы и аудио со сторонних ресурсов
Можно использовать диктофон, чтобы отправлять боту голосовые, которые он тут же расшифрует. А еще расшифровывать аудио на четырех языках — русском, английском, французском, немецком.
Вконтакте
Автотранскибация: есть
Транскрибация через микрофон: нет
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: да
Где работает: приложения Android, iOS
Есть один лайфхак, как расшифровывать голосовые сообщения в мобильном приложении Вконтакте. Вот пошаговая инструкция, как это работает:
- Заходите в раздел с диалогами
- Через поиск находите свой аккаунт
- Нажимаете значок микрофона
- Диктуете сообщение
- Как только оно появится в диалоговом окне, тапаете значок «Аа»
- Получаете текст
По такой схеме можно расшифровывать голосовые месседжи или проигрываемый через аудиоколонку файл. Напечатанный текст нельзя экспортировать — только скопировать руками и вставить в отдельный файл.
Yandex SpeechKit
Автотранскибация: есть
Транскрибация через микрофон: да
Цена: 0 ₽
Распознает знаки препинания: ❌
Можно загрузить файл: нет
Где работает: браузер
Очень простенький сервис. Не работает с загружаемыми файлами — расшифровывает только надиктованный через микрофон текст. Не расставляет знаки препинания, а еще имеет ограничение по максимальной длине надиктованного текста: она не должна превышать минуты.
Сравнительная таблица
Возможные проблемы, связанные с переводом речи в текст
С онлайн-сервисами на самом деле не так все гладко. Они могут допускать в расшифровке ошибки, и вот почему:
- быстрая, нечеткая речь диктора, которую алгоритмы не распознали или распознали не так
- посторонние шумы — ветер, голоса людей, шум с дороги — заглушили речь на записи
- сильный акцент исказил привычное звучание слов
Подведем итоги
- Транскрибация — это перевод аудио в текст. Её может выполнять живой исполнитель или специальный онлайн-сервис.Транскрибацию используют, когда надо расшифровать запись звонков, интервью, либо подготовить субтитры
- Чтобы перевести в текст голосовые сообщения, можно использовать Google Документы, Google Keep, Dictation, Telegram
- Аудиофайлы умеют транскрибировать Speechpad, RealSpeaker, Speechnotes
- Совсем простенькую транскрибацию можно сделать через мобильное приложение Вконтакте и Yandex SpeechKit. А для ручной транскрибации используйте oTranscribe