Подборка сервисов для расшифровки аудио в текст
Содержание:
- ТОП лучших программ для преобразования видео в аудио
- Преобразование речи в текст с микрофона
- Запуск онлайн-сервиса dictation
- Способ 4. RealSpeaker
- Способ 3. Speechpad.ru
- Связь 1С и виртуальных АТС (Мегафон, Zadarma(Задарма)). Звонки из 1С. Журнал звонков сотрудников и клиентов
- Расшифровка аудио и видео в текст на биржах фриланса
- Стационарные программы для голосового ввода
- Speechpad.ru – инструмент для распознавания речи
- Голосовой набор текста
- Программы для озвучки текста
- Troubleshooting
- Настройка виртуального кабеля
- Веб-сервисы и приложения для голосового ввода
- Заказ перевода аудио в текст у специалистов
ТОП лучших программ для преобразования видео в аудио
Список состоит из наиболее популярных и качественных конвертеров:
- Online Audio Converter;
- Zamzar онлайн-конвертер;
- FFmpeg.
Неоспоримое удобство онлайн конвертеров заключается в том, что не нужно устанавливать ПО на компьютер. При необходимости можно открыть онлайн сервис и конвертировать видео в аудио или извлечь определенную аудиодорожку, отрезок из фильма, клипа. Многофункциональные конвертеры позволяют даже преобразовать текстовый документ в аудио.
Online Audio Converter
Удобная и простая программа для конвертации видео в mp3 или другие популярные аудио форматы. Бесплатный онлайн сервис отличается широкими функциональными возможностями. Достаточно лишь зайти на сайт, выбрать нужный раздел (аудио конвертер, обрезать песню, объединить файлы), загрузить файл и запустить процесс. Приложение поддерживает все известные форматы – это более трехсот аудио и видео. Конвертация возможна в mp3, m4a, flac, wav, ogg, amr, mp2, m4r. Легко можно сохранить саундтрек из любимого фильма или отрезок клипа. Доступ к загружаемым файлам только у пользователя, а через несколько часов они полностью удаляются из системы.
Плюсы:
- Не требует установки на ПК;
- Гарантированная конфиденциальность;
- Расширенные настройки включают изменение качества, включение реверса, удаление голоса;
- Можно конвертировать одновременно группу файлов;
- Доступно сохранение в ZIP-архиве для ускорения загрузки.
Минусы:
- Для работы нужно подключение к Интернету;
- Наличие рекламы.
Отзыв: «Отличный ресурс для конвертации онлайн, качественно и быстро (при достаточной скорости Вашего интернет соединения)».
Zamzar онлайн-конвертер
Простой бесплатный конвертер онлайн поддерживает огромное количество форматов, включая WPD, RA, FLV, DOCX. Загрузить файл для конвертации можно с компьютера или сайта. Приложение легко преобразовываем между многими форматами изображений, документов, видео, аудио, архивов и CAD форматов. Для расширенного доступа стоит воспользоваться платным премиум-сервисом, где нет ограничений в размерах файлов и можно сохранять готовые работы в онлайн-хранилище. Ассортимент конвертируемых форматов постоянно обновляется. Есть возникают трудности с преобразованием, то можно обратиться в сервис поддержки и опытные специалисты помогут решить проблему.
Плюсы:
- Готовый файл можно отправить на электронный адрес;
- Не нужно устанавливать ПО и занимать место на жестком диске;
- Работает с любой операционкой – MAC, Windows и Linux;
- Преобразует файлы txt в mp3 высокого качества;
- Платная версия снимает ограничения в размерах и отключает рекламу.
Минусы:
- Более длительное время конвертации, чем у аналогов;
- Ограниченный размер файлов – до 150 МБ.
Отзыв: «Рекомендую обратить внимание на этот сервис. Простой и понятный интерфейс
Конвертация аудиофайла в нужный формат для мобильного устройства заняла считанные минуты. Готовый файл было предложено сохранить в полном и сжатом виде».
FFmpeg
Многофункциональный кодер с открытым исходным кодом позволяет записывать, конвертировать и передавать аудио и видео файлы в различных форматах. С его помощью можно записывать даже видео в реальном времени с TV-карты. Разрабатывался FFmpeg для ОС Linux, но может работать и с другими системами. Это приложение подойдет для профессионалов, разработчиков медиа приложений и для домашней обработки записей. Оно не имеет графического интерфейса, управляется командами из консоли. Также есть онлайн-сервис с упрощенным функционалом программы. Доступны широкие возможности для редактирования аудио перед конвертацией: можно обрезать, объединять, настраивать звук.
Плюсы:
- Гибкие настройки многих параметров;
- Простая установка ПО;
- Является основой для популярных приложений – VLC, YouTube, iTunes;
- Можно добавлять изображение обложки в аудио;
- Быстрая конвертация.
Минусы:
- Не подходит для новичков;
- Длительный процесс подготовки задач.
Интересные, удобные и простые приложения для конвертирования нужны и для домашнего использования, и для профессиональной работы с графическим контентом. Лучшие видео конвертеры предлагают комплексную обработку файлов, то есть можно отредактировать, вставить субтитры, авторские знаки и прочее. Выбрать подходящий вариант с учетом задач, которые нужно решать, поможет данный обзор популярных программ.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Преобразование речи в текст с микрофона
Подключите и включите микрофон компьютера и закройте любые приложения, которые также могут использовать микрофон. Некоторые компьютеры имеют встроенный микрофон, в то время как для других необходима настройка устройства Bluetooth.
Итак, все готово для запуска интерфейса командной строки службы «Речь» для распознавания речи с микрофона. В командной строке перейдите в каталог с двоичным файлом интерфейса командной строки службы Речи и выполните следующую команду.
Примечание
По умолчанию интерфейс командной строки службы «Речь» использует английский язык. Вы можете выбрать другой язык из таблицы преобразования речи в текст.
Например, для распознавания речи на немецком добавьте .
Начните говорить в микрофон, и вы увидите расшифровки слов в виде текста, появляющиеся в реальном времени. Интерфейс командной строки службы «Речь» будет останавливаться после периода молчания или при нажатии клавиш CTRL-C.
Запуск онлайн-сервиса dictation
Этот онлайн сервис работает прямо в браузере, поэтому его не надо устанавливать. Он использует движок Гугла для того, чтобы распознать речь и сразу перевести её в текст.
Разработчики рекомендуют использовать браузер Google Chrome для запуска сервиса. Вероятно, такая рекомендация связана с тем, что разработки одного и того же производителя (в данном случае браузер и движок Гугла) лучше всего работают в связке друг с другом. Хотя сервис перевода речи работает не только в Гугл Хроме, но и в других браузерах.
Dictation легко запустить, работа с ним интуитивно понятна.
Рис. 1. В браузере открыт сервис Dictation.
Чтобы запустить Dictation:
- надо открыть браузер;
- в адресной строке браузера ввести dictation.io (цифра 1 на рис. 1);
- затем нажать на кнопку «LAUNCH DICTATION» (2 на рис. 1).
Рис. 2. Нажав на кнопку «Start», можно говорить текст.
Чтобы начать диктовку, потребуется нажать на синюю кнопку «Start». После этого она превратится в «Stop».
Произносить текст надо четко и внятно, без ускорений и замедлений. Микрофон должен быть в исправном состоянии. Говорить можно по-русски, хоть меню программы сделано не на русском языке.
Для того чтобы остановить запись речи и ее автоматический перевод в текст, следует обязательно кликнуть на синюю команду «Stop».
Как поставить знаки препинания, начать новую строку или новый абзац
Есть некоторые моменты, на которые следует обратить внимание при диктовке. Для того чтобы в тексте была поставлена запятая, необходимо четко вслух произнести слово «Запятая»
Такую команду желательно проговаривать вместе с остальным текстом, без дополнительных пауз и задержек. Если же будет пауза, а потом произнесена команда «Запятая», тогда сначала в напечатанном тексте будет поставлен лишний пробел, и после него запятая. Пробел перед запятой придется удалять вручную, а это дополнительное ручное действие.
То же самое относится к точке. Её, как известно, следует ставить в конце предложения. Для этого придется сказать команду «Точка» в конце каждого предложения, причем сказать без паузы, в том же темпе, как произносится весь текст.
Для получения в тексте вопросительного знака, необходимо произнести команду «Знак вопроса». В итоге в конце предложения появится требуемый знак – «?».
Для выражения восклицаний понадобится команда «Восклицательный знак». Тогда предложение закончится знаком «!».
Чтобы начать текст с новой строки, надо произнести команду «Новая строка».
Аналогично потребуется сказать «Новый абзац», чтобы в тексте появился следующий абзац.
Способ 4. RealSpeaker
Простой и удобный, но платный онлайн сервис. Стоимость — 8 рублей/минута, до 1,5 минут — бесплатно. Если объем файла для транскрибации небольшой по времени, есть смысл им воспользоваться.
Достоинства RealSpeaker:
- работает с загруженными медиафайлами
- воспринимает 37 языков мира
- указывает расчетное время транскрибации
Недостатки сервиса:
- платный
- готовый текст после транскрибации доступен всем пользователям.
Рассмотрим бесплатный вариант.
Шаг 1. Заходим на сайт RealSpeaker. Сервис предложит выбрать язык речи, используемый в нашем медиа — выбираем. Нажимаем кнопку «Продолжить».
Шаг 2. Выбираем медиа файл, который необходимо транскрибировать.
Шаг 3. Проверяем, какой файл загрузился, и смотрим, сколько времени займет транскрибация. Нажимаем «Перейти в Мои медиа».
Шаг 4. Нажимаем кнопку «Транскрибировать», которая находится в таблице «Мои медиа» напротив загруженного медиа файла.
Шаг 5. По завершению транскрибации напротив файла появится кнопка «Текст». Нажимаем на неё.
Шаг 6. Откроется окно с текстом и небольшая панель инструментов для редактирования.
Получившийся текст копируем себе в документ и при необходимости исправляем ошибки.
Способ 3. Speechpad.ru
Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:
А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга.
Плюсы блокнота:
- работа и с микрофоном, и с медиа файлами
- набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
- сохранение готового текста в файл
Минус пользователи отметили лишь один, и он несущественный — корректно блокнот работает только в браузере Google Chrome.
Рассмотрим транскрибацию видеоролика с Youtube.
Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.
Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».
Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»
Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.
ID ролика находится в адресной строке Youtube после знака «=».
Нажимаем кнопку «Обновить».
Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»
Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.
Связь 1С и виртуальных АТС (Мегафон, Zadarma(Задарма)). Звонки из 1С. Журнал звонков сотрудников и клиентов
Связка 1С и виртуальных АТС (от Мегафон, Zadarma (Задарма)) позволит четко ответить на вопросы: кто звонил, когда звонил, кому звонил, сколько говорил, сколько ждал на линии, что особо актуально при удаленной работе операторов и менеджеров, о чем говорили, результат разговора, обработаны ли пропущенные звонки, прослушать сам разговор, запланировать встречу, звонок, напоминание по результатам разговора. Возможность позвонить клиенту прямо из 1С одной кнопкой, оставить комментарий о звонке, посмотреть по каждому партнеру и клиенту, контакту клиента историю его звонков и взаимоотношений.
9600 руб.
Расшифровка аудио и видео в текст на биржах фриланса
Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.
Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ — задание на транскрибацию.
Для своего заказа на бирже можно выбрать исполнителя — человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.
Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.
Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.
Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.
Две биржи фриланса
Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:
Биржа фриланса weblancer.net
Другая биржа, где можно заказать расшифровку аудио/видеозаписей — freelance.ru
Биржа фриланса freelance.ru
Дополнительные материалы:
1. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер
2. При просмотре роликов на ноутбуке заикается звук
3. Как всегда открывать видео удобным плеером в Windows 10
4. Программы для создания электронной книги
5. Оповещения Google Alerts – зачем и как пользоваться, примеры использования
Статья впервые была опубликована 5 июля 2017 г., последнее обновление 13 мая 2021 г.
Распечатать статью
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик. Уже более 3.000 подписчиков
.
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам
Стационарные программы для голосового ввода
Кроме перечисленных сервисов существуют разнообразные стационарные программы, позволяющие перевести речь в текст. Обычно они имеют в своей структуре встроенный механизм для распознавания текста, работают с множеством языков, и во многих случаях не требуют постоянного подключения к Интернету.
Среди таких программ отметим следующие:
- «Dictate» — специальная программа-надстройка для MS Word. После установки программы в системе откройте ваш Ворд, и выберите в нём вкладку «Dictation». Появится значок с микрофоном. Рядом с последним выберите русский язык и начните запись;
- «Dragon Professional Individual» (Windows, Mac) – одна из лучших платных программ в своём сегменте. Включает множество инноваций, поддерживает различные голосовые команды формата, имеют мощные возможности транскрибации;
- «Braina Pro» (Windows) – это целый виртуальный ассистент, управляемый искусственным интеллектом. Вы можете диктовать ему текст более чем на 100 языках, он отлично понимает различные компьютерные команды, устанавливает будильник, служит как словарь и тезаурус;
- «E-speaking.com» (Windows) — Используя программный интерфейс «Microsoft Speech Application» и «Net Framework», программа «e-Speaking» позволяет использовать голос для управления ПК, диктовки документов и электронных писем, прочтения текста вслух. Поддерживается множество голосовых команд для управления ПК.
Speechpad.ru – инструмент для распознавания речи
Сервис speechpad.ru – один из наиболее популярных в Рунете сервисов для перевода голоса в текст. Сервис позиционирует себя как блокнот для речевого ввода, позволяющий надиктовывать предложения, а также транскрибировать текст из аудио и видео файлов.
Для работы с сервисом выполните следующее:
- Перейдите на speechpad.ru;
- Выберите внизу язык распознавания (например, «Русский»);
- Нажмите внизу на кнопку «Включить запись»;
- Разрешите сайту доступ к вашему микрофону, и начните диктовку текста. Учтите, что все знаки препинания в тексте проговориваются голосом («запятая», «точка», «тире» и др.). То же самое и с абзацами.
- Для скачивания результата в формате .txt нажмите на «Скачать»;
- Для проведения считки текста с аудио или видеофайла нажмите на кнопку «+Транскрибацию».
Голосовой набор текста
Нажмите кнопку «включить запись». При первом посещении сайта вверху браузера возникнет панелька с просьбой разрешить доступ к микрофону. Нажмите там кнопку «Разрешить»
Говорите в микрофон
Кнопка A/a меняет регистр первой буквы слова, рядом с которым находится курсор
Кнопка Отменить удаляет из результирующего поля последний введенный фрагмент
Кнопки пунктуации служат для ввода знаков с помощью мыши
Текст в результирующее поле добавляется после последней позиции курсора. Если был выделен фрагмент текста в результирующем поле, то введенный текст будет его заменять
Установка флажка Отключить управление заглавными буквами Google отменяет простановку заглавных букв анализатором Google.
Если отмечен флажок Заменять слова пунктуации, то слова в голосовом вводе, совпадающие со знаками препинания, будут заменяться на эти знаки. Соответствующие слова можно увидеть, если навести мышь на кнопку знака.
*В настоящее время Google самостоятельно заменяет слова: точка, запятая, вопросительный и восклицательный знаки, поэтому при отключении флажка замена все равно может проводиться.
Смена языка для голосового ввода осуществляется выбором соответствующего языка в выпадающем списке. Если языка нет в списке, но он поддерживается для голосового ввода, то его можно добавить в кабинете пользователя (доступен после регистрации)
Если отмечен флажок Выполнять команды, то во время ввода текста можно давать команды голосом.
Если отмечен флажок Вывод в буфер обмена, то текст будет поступать не в результирующее поле, а в буфер обмена. Флажок работает только при установленном расширении блокнота.
Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла.
Программы для озвучки текста
Если вам нужно постоянно озвучивать большие объемы текста из электронных документов, то самый удобный вариант — установить специальные приложения, которые умеют работать с файлами разного формата.
Балаболка
Балаболка — бесплатная программа озвучки для Windows от российских разработчиков. Она поддерживает работу с любыми голосовыми движками, установленными в системе. В ее интерфейсе есть стандартные инструменты для управления воспроизведением: пауза, остановка, перемотка, изменение скорости и громкости.
«Балаболка» умеет читать вслух текст из буфера обмена, произносить набираемые на клавиатуре фразы, озвучивать содержимое редактора или загруженных в нее файлов в форматах AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, WPD, XLS, XLSX.
Результат обработки «Балаболка» сохраняет как аудиофайл в форматах WAV, MP3, MP4, OGG и WMA. У нее также есть возможность сохранения текста внутри файлов MP3 для дальнейшего отображения в виде субтитров в медиапроигрывателе.
Govorilka
Govorilka — ещё одна программа для озвучки с минималистичным интерфейсом. Поддерживает голосовые движки устаревшего стандарта SAPI 4, в том числе на иностранных языках.
По умолчанию Govorilka озвучивает текст голосом стандартного движка Microsoft. В ее составе есть инструменты управления, традиционные для программ такого типа: воспроизведение, пауза, остановка, изменение скорости, громкости и высоты голоса. Одновременно в ней можно открыть до 8 вкладок с разными фрагментами текста.
Несмотря на простоту и устаревший интерфейс, «Говорилка» всё еще актуальна. Она умеет распознавать текстовые документы в разных форматах объёмом до 2 Гб и сохранять результат обработки в MP3 и WAV.
eSpeak
eSpeak — бесплатная программа для озвучки текста, доступная на Windows, macOS, Linux и Android. Она использует голосовые движки, установленные в системе, а также добавляет к ним несколько своих.
Версия этого приложения для Windows имеет максимально простой интерфейс и управление. Текст, который нужно прочитать, достаточно вставить в поле посредине окна, а затем нажать “Speak”.
Максимальный размер текста здесь явно не определен, но приложение справляется с большими объёмами. Также у него есть возможность читать тексты из файлов с расширением TXT, другие форматы не поддерживаются.
Для управления скоростью чтения в eSpeak используется ползунок Rate. Если вы хотите сохранить прочитанный текст в аудиофайл, нажмите на кнопку «Save to .wav» и задайте имя записи.
В мобильной версии приложения для Android аналогичная функциональность, разве что нет возможности сохранить текст в аудио.
Acapela TTS
Acapela Group разрабатывает программы для всех популярных операционных систем: Windows, macOS, Linux. Android, iOS. Среди главных достоинств этого софта — поддержка большого количества языков и отличное качество голоса. Мощные движки хорошо обучены и имеют развёрнутую справочную базу, которая позволяет им говорить правильно и выразительно.
Однако все продукты Acapela коммерческие. Установить приложение на компьютер или телефон можно бесплатно, но без купленного голосового движка в них нет никакого смысла. Стоимость одного пакета — 3,99 евро. Прежде чем оплачивать покупку, вы можете прослушать демо голоса с произвольным текстом, чтобы определить, подходит ли вам такое звучание.
ICE Book Reader Professional
Если вы ищите программу, которая будет озвучивать целые книги, то попробуйте ICE Book Reader Professional. Это приложение поддерживает различные форматы текстовых документов: TXT, HTML, XML, RTF, DOC и DOCX, PALM (.PDB и .PRC), PSION/EPOC (.TCR), Microsoft Reader (.LIT), Microsoft HELP files (.CHM) и FictionBook файлы (все версии) (.FB2, .XML). А для чтения в нем используются голосовые движки стандарта SAPI 4 и 5.
Программа умеет превращать книги в MP3/WAV-файлы. Это значит, что вы можете из любого произведения, доступного в текстовом формате, сделать аудиокнигу.
Скорость преобразования текста в голос в этом приложении увеличивается за счёт одновременного использования нескольких модулей синтеза речи.
Troubleshooting
- No speech. First of all, check your speakers and volume. Also the voice might be unavailable for the given volume/speed/pitch. Simply adjust your options.
- The browser doesn’t support speech recognition : the latest version of Chrome does.
- There are issues with your microphone (when saving as an audio file):1. Hardware problem with the microphone : make sure your computer has detected your microphone.2. Permission for accessing the microphone is not granted. Allow our Speech Recognition tool to have access to your microphone.3. The browser listens to the wrong microphone.To solve microphone permission issues, click on the small camera icon in the browser’s address bar (will appear after you click on the play button), set there the permission to allow the use of the microphone and pick the correct microphone from the dropdown list.
If you have other issues, please contact us describing the problem in detail.
Настройка виртуального кабеля
1. Скачиваете виртуальный кабель, распаковываете его в папку и запускаете либо VBCABLE_Setup.exe, либо VBCABLE_Setup_x64.exe (в зависимости от разрядности вашей Windows)
2. Открываете окно управления записывающими устройствами и делаете CABLE Output устройством по умолчанию.
3. Открываете окно управления устройствами воспроизведения и делаете CABLE Input устройством по умолчанию.
4. Теперь можно приступать к транскрибированию. После этих манипуляций звук будет идти из выхода аудио на запись, микрофон при этом перестает работать. Чтобы вернуть его для работы нужно сделанные исменения откатить (вернуть все назад).
Веб-сервисы и приложения для голосового ввода
Для использования голосового ввода от случая к случаю можно обойтись без установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.
Google Docs
Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.
Как пользоваться голосовым вводом в Google Docs:
- Откройте сайт поисковой системы Google.
- Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
- Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
- Нажмите «Ещё», чтобы увидеть полный список.
- Перейдите в «Документы».
- В поле «Создать документ» нажмите «Пустой файл».
На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.
Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.
После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.
Speechpad
Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.
- Откройте сайт Speechpad.ru.
- Пролистните главную страницу до окна редактора.
- Выберите язык ввода.
- Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
- Диктуйте текст.
Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.
Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».
Итоговый документ доступен для скачивания в формате TXT.
VoiceNote
VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться VoiceNote:
- Откройте редактор.
- Нажмите на значок в виде земного шара и выберите язык ввода.
- Кликните по иконке микрофона.
- Разрешите использование записывающего устройства.
- Диктуйте текст.
Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.
Полученный документ доступен для сохранения в формате TXT.
TalkTyper
TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.
Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.
Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.
Voice Notepad
Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.
Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.
Заказ перевода аудио в текст у специалистов
Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.
Поэтому я нанимаю фрилансеров. Но.. И тут есть «засады»! Очень сложно найти «правильного» фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.
Сервис расшифровки аудиозаписей в текст Zapisano.org
Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…
Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который «заточен» под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.
Из «приятных плюшек» хочу отметить еще три, особо мне понравившихся.
- Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
- Работа с PayPal. Это означает, что с сервисом могут работать «забугорные» люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
- Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..
Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.