Приложение для голосового набора. Набор текста голосом

Распознавание речи - технология, позволяющая значительно повысить продуктивность как на работе, так и дома. Надиктовать документ можно в три раза быстрее, чем напечатать его.

Распознавание речи онлайн

Чтобы преобразовать речь в текст, можно воспользоваться соответствующим онлайн-сервисом в браузере. Сайты по распознаванию речи, как правило, не требуют регистрации и оплаты, они очень удобны в использовании. В первую очередь, потребуется установить браузер Google Chrome. Это связано с тем, что все сервисы работают на одном и том же движке распознавания речи от Гугл. Качество распознавания зависит от микрофона, а также ритма и четкости речи.

Читайте также: Включение микрофона на Windows 8

Способ 1: Speechnotes

Спичноутс - самый популярный сервис по распознаванию речи онлайн, предоставляющий большой выбор языков, расширенные возможности постановки знаков препинания и отправки надиктованного текста в сторонние приложения.

Онлайн-сервис Speechnotes

Порядок действий:

    1. Нажмите на иконку микрофона справа.
    2. Выберите «Разрешить» во всплывающем окне браузера. Слева над иконкой микрофона появится мигающий красный кружок - это означает, что запись включена.


    1. Выберите русский язык из выпадающего меню.


    1. Начните диктовать.
    2. Чтобы остановить запись, снова нажмите на иконку микрофона.
    3. Скопируйте текст в буфер обмена (А) или отправьте в сторонние сервисы, используя панель инструментов слева (B).


Для расстановки знаков препинания есть три способа:

    1. Диктовка: справа есть перечень знаков с соответствующим произношением;


    1. Набор на клавиатуре - самый быстрый способ, так как добавляет знак еще до того, как заканчивается речь. Здесь главное дождаться, пока надиктованная речь появится в буфере (см. скриншот) и только после этого нажимать кнопку, иначе знак препинания появится перед надиктованной речью, а не после;


  1. Кнопка на сайте - достаточно нажать соответствующий знак препинания в панели справа (см. пункт 1).

Результаты распознавания во многом будут зависеть от качества микрофона и диктовки. Для наилучшего результата говорить нужно медленно и четко. Это относится ко всем сервисам по распознаванию речи.

Способ 2: Speechlogger

Спичлоггер - многофункциональный сервис по распознаванию речи, с помощью которого можно не только диктовать тексты, но и переводить их на другие языки в режиме реального времени с Google Translate, а также транскрибировать аудиофайлы.

Онлайн-сервис Speechlogger

Чтобы начать запись на сайте Speechlogger, выполните следующие действия:

    1. Зайдите на сайт, прокрутите немного вниз до блока с голубым фоном и нажмите на иконку микрофона.
    2. Выберите «Разрешить» .
    3. Найдите в списке русский язык, если это необходимо.
    4. Нажмите на кнопку справа вверху, чтобы блок распознавания речи занимал весь экран (это не обязательно, но так удобнее работать).


    1. Начинайте диктовать.
    2. Текст, в котором может быть ошибка, выделяется красным цветом. Это позволяет быстрее находить неточности и исправлять их.


    1. После того, как работа закончена, снова нажмите на иконку микрофона.
    2. Выделите весь текст с помощью кнопки All (A) и скопируйте, нажав правой кнопкой мыши и выбрав «Копировать» (сочетание клавиш Ctrl+C не работает), либо воспользуйтесь панелью инструментов (B), чтобы отправить текст по электронной почте, сохранить в формате.txt, .doc, загрузить на Google Drive или распечатать.


Способы постановки знаков препинания:

    1. Диктовка: чтобы узнать, как произносить тот или иной знак препинания, наведите на него курсор - во всплывающем окне появится подсказка.
    2. Просто нажмите на знак препинания в панели, расположенной над областью для текста.


    1. Автопунктуация: на сайте можно задать настройки для автоматической постановки знаков препинания. Не очень удобный вариант, так как при каждой паузе система ставит точку, при этом русский язык слишком гибкий и многообразный - задать четкие условия для постановки определенных знаков препинания невозможно. Поэтому рекомендуется отключить эту функцию, убрав соответствующую галочку.


Дополнительные настройки расположены в верхнем левом углу.


С их помощью можно включить или отключить следующие функции:

    • Автосохранение текста: если функция включена, доступ ко всем сессиям можно получить, нажав на иконку папки в панели инструментов;


  • Выделение слов красным шрифтом;
  • Отметки времени в тексте (включены по умолчанию).

Кроме того, можно задать настройки для автопунктуации и изменить цвет фона.

Способ 3: Online Dictation

Online Dictation - удобный сервис с лаконичным интерфейсом. Основное преимущество - простота в использовании.

Онлайн-сервис Dictation

    1. Сервис автоматически определяет язык по умолчанию, настроенный в браузере. Если язык не установлен либо используется гостевая учетная запись Chrome, необходимо установить русский: выпадающий список языков расположен внизу под областью для текста.


    1. Нажмите кнопку «Start Dictation» .


    1. Разрешите использование микрофона на сайте.


    1. Начинайте диктовать. Для постановки знаков препинания используйте голосовые команды: «точка», «запятая», «вопросительный знак», «восклицательный знак», остальные знаки ставятся при помощи клавиатуры. Для начала нового абзаца действует голосовая команда «новый параграф», для перехода на новую строку - «новая строка».
    2. Закончив диктовать, нажмите «Stop Listening» .


  1. После того как текст готов, его можно:
    • Скопировать, нажав кнопку «Copy» (1);
    • Сохранить в формате.txt, нажав кнопку «Save» (2);
    • Стереть, нажав кнопку «Clear» (3).


Способ 4: SpeechTexter

Сервис по распознаванию речи СпичТекстер отличается красивым компактным дизайном и позволяет редактировать текст прямо на сайте. Форматирование сохраняется при переносе текста в сторонний редактор.

Онлайн-сервис SpeechTexter

    1. Для прекращения записи нажмите «Stop» .


    1. После того, как текст записан, его можно отформатировать, используя инструменты на панели, расположенной над текстом.


    1. Готовый текст можно скопировать (1), сохранить в формате.txt (2) или распечатать (3).


Код для вставки на сайт.

Совет: можно изменить свойство recognition.lang и подставить ‘ru-RU’ вместо ‘en-US’, тогда по умолчанию устанавливается русский язык.

У каждого из сервисов есть свои преимущества и недостатки. Рекомендуется попробовать поработать на каждом из них и выбрать наиболее подходящий, исходя из своих целей и предпочтений.

Приветствую вас, уважаемые читатели блога сайт! Давно собирался подготовить заметку о программах и онлайн сервисах, при помощи которых можно переводить свой голос прямо в текст. Как рассказчик (мне кажется), я неплохой, но вот излагать свои мысли в виде печатного текста мне дается с большим усилием. Вот я и задался целью найти «чудо-сервис», который смог бы мою речь преобразовать в текст.

Актуальность набора текста голосом на сегодняшний день очевидна. Ведь не зря разработчики Google «вкрутили» в свой браузер Google Chrome голосовой поиск. И уже на основе этого открытого кода некоторые программисты и Web мастера сделали разные блокноты и сервисы для преобразования речи в текст в онлайн режиме. Для многих пользователей и особенно пользователей с ограниченными возможностями это просто незаменимые сервисы.

Попробовав в работе один из сервисов, которые я приведу ниже, возможно, не каждый получит желаемый результат. Особенно те, кто постоянно набирают тексты на компьютере, и для кого с текстами является основным источником дохода. И многие хотели бы как-то облегчить этот нелегкий труд. Но, если немного потренироваться, перевод голоса в текст в этих онлайн сервисах может получаться вполне качественный.

Чтобы приступить к преобразованию голоса в текст, понадобится микрофон (в ноутбуках он встроенный), желательно хорошая скорость интернет соединения и браузер Google Chrome не ниже 25 версии. В других браузерах функция голосового набора текстов, к сожалению, не работает. Как я уже говорил, код голосового распознавания в текст от разработчиков Google является открытым, и его можно использовать на своем сайте. Вот и я немного его русифицировал и установил на свой блог.

Голосовой ввод текста с помощью Web Speech API

Запустите страницу для ввода текста голосом в браузере Chrome. Внизу окна выберите язык, на котором вы планируете диктовать текст. Нажмите на иконку микрофона в верхнем правом углу. И в всплывшей строке нажмите кнопку «разрешить» использование браузером микрофона.

Теперь вы можете неспеша и четко наговаривать недлинные фразы. После завершения надиктовки текста голосом его можно выделить и при помощи комбинации клавиш на клавиатуре Ctrl+C скопировать в буфер обмена, а затем вставить в любой редактор для обработки. При желании текст можно сразу отправить по электронной почте.

Пожалуй, Web Speech API – самый простой и довольно качественный способ преобразовать свою речь в текст. Так как не надо отвлекаться на какие-то дополнительные манипуляции с клавиатурой. Просто включил микрофон и говори текст. В любом случае придется использовать какой-нибудь дополнительный текстовый редактор для дальнейшей корректировки надиктованного текста.

Преобразование речи в текст на странице сайта Online Dictation

Простой «буржуйский» блокнот, расположенный на странице Dictation , имеет всего три кнопки. Включить микрофон для записи, очисть поле для ввода текста и экспортировать надиктованный текст на свой компьютер, Google Диск, хранилище Dropbox или отправить электронной почтой в текстовом формате TXT. Все очень просто. Пробуйте, тестируйте и наслаждайтесь полученным результатом.

Набор текста голосом - онлайн сервис Talk Typer

Этот «буржуйский» онлайн блокнот распознавания голоса имеет несколько дополнительных встроенных функций. Возможность заменять продиктованные слова на другие предложенные варианты. Вставлять знаки пунктуации. Прослушать надиктованный текст, нажав на иконку динамик. Сделать перевод на выбранный иностранный язык. При желании можно изменить отображение внешнего вида и размер шрифта, нажав на иконку «шестеренка». Единственное неудобство: после каждой произнесенной фразы ее надо сбрасывать в нижнюю часть блокнота, нажимая на стрелку, и затем снова включать микрофон. В целом, это полноценный сервис, в котором можно преобразовать речь в текст и отредактировать его по своему усмотрению. Готовый текст можно распечатать, Твитнуть или отправить на электронную почту.

Распознавание голоса в блокноте VoiceNote

Этот сервис распознавание голоса в текст можно установить как приложение в браузер Chrome, или просто добавить в закладки сайт , который находится . Войснот по функционалу практически ничем не отличается от предыдущего сервиса-блокнота распознавания речи Talk Typer. Такой же основной минус, после каждой произнесенной фразы надо снова включать микрофон. Но зато не надо перемещать надиктованный текст, как в Talk Typer. Простой и очень удобный интерфейс сервиса для преобразования текста. Думаю, что он многим придется по душе. Тестируйте и делайте выводы.

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Осуществляется через микрофон. Произнесённые слова - это источник акустических волн, которые представляют собой периодически чередующиеся разряжения и уплотнения окружающего воздуха.

Волна, попадая на микрофон, вызывает на его выходе электрический сигнал определённой амплитуды и частоты. Данный сигнал преобразуется в последовательность прямоугольных импульсов, кодируемых в виде «единиц» и «нулей», и затем может обработан компьютером.

С появлением компьютеров, обладающих достаточной вычислительной мощностью, набор текста голосом в компьютер стал реальностью, благодаря чему удаётся существенно снизить нагрузку на клавиатуру.

Компьютерная технология ввода информации с голоса предусматривает настройку на голоса различных людей. Этот метод называется настройкой компьютера на конкретный голос. Состоит он в следующем. Все слова, которые человек произносит первый раз, компьютер обрабатывает и заносит в свою базу данных в качестве образцов. Когда в дальнейшем человек произносит речь, компьютер мгновенно пытается найти каждое слово в своей базе данных. Сейчас уже существуют современные компьютерные системы, которые без тренировки могут работать с любым голосом.

Применение такой технологии позволяет не только вводить текстовую информацию, но и управлять компьютером с помощью произношение команд.

Когда полезен набор текста голосом ? Он удобен при вводе в компьютер писем, текстов отчётов, сложных научных или деловых документов. Такое средство общение с компьютером будет очень удобно врачам, юристам, журналистам, секретарям, администраторам различного уровня, переводчикам, писателям и многим другим.

Голосовой ввод информации незаменим в тех случаях, когда у пользователя руки оказываются занятыми другой работой, а надо срочно дать компьютеру команду для управления определённых задач. Это может понадобиться операторам на технологических линиях, учёным, медицинским работникам и т. п. Данный метод может оказаться единственно возможным также в том случае, когда основная работа выполняется в затемнённом помещении и ввод данных с клавиатуры затруднён, или человек должен находиться на достаточном удалении от компьютера. Кстати, в этой ситуации возможен ввод данных через радиоуправляемый микрофон. Существует также возможность ввести данные или команды на удалённый компьютер по компьютерной сети.

Как начать пользоваться голосовым набором текста на домашнем компьютере?

Для этого нужно подключить микрофон к компьютеру и перейти на сайт http://speechpad.ru/ Данный онлайн-сервис позволяет набирать текст голосом в голосовом блокноте.

Процесс голосового ввода довольно прост. Выставляем настройки для записи, и можно диктовать текст голосом. Кнопку «Включить запись» используйте для непрерывного ввода текста. Для ввода отдельных фраз или предложений используется значок микрофона.


Всем, кто часто использует компьютер, знакома проблема с набором длинных текстовых сообщений. Особенно часто приходится набирать тексты студентам, блогерам, журналистам и другой пишущей братии. Чтобы написать одну полноценную статью требуется пять-шесть часов напряженного труда, а для узкопрофессиональных текстов это время значительно увеличивается. Для тех, кто не любит набирать много букв на клавиатуре, придуманы специальные программы, позволяющие преобразовывать звуковые сообщения в текстовые файлы. Подобные возможности можно найти в специальных приложениях, разработанных для различных устройств. «Голосовой блокнот» — общее название для прог, превращающих звуки в буквы, и позволяющих значительно сократить время работы над текстом. Его использование значительно облегчит труд автора: большая часть работы будет сводиться к поиску и обработке материала будущего текста, а не к его набору. Давайте ознакомимся с возможностями программы для распознавания голосовых сообщений и протестируем ее на адекватность и полезность.

Знакомимся с голосовым блокнотом

Итак, чем же может нам помочь аудио блокнот? Разработчики утверждают, что он может выполнять такие функции, как:

  • создание голосовых заметок;
  • сохранение звуковых сообщений в локальном месте собственного устройства или же на облаке Гугл;
  • поддержка списка заменяемых слов;
  • расстановка знаков препинания.

Пользователь может использовать различные инструменты для расширения функций блокнота. К примеру, можно настроить ввод заглавных букв, упростить распознавание текста, делать откат ввода по специальной команде и многое другое. Общий смысл заключается в том, чтобы не только пользоваться аудио тетрадью, но и настроить его под собственный стиль речи. В этом случае конечное редактирование текста сведется к минимуму.

Перед установкой

Голосовой блокнот является бесплатным онлайн-сервисом, который предоставляется бесплатно в магазине Google. Данное приложение является расширением Chrome, поэтому работать оно будет лишь в этом браузере. Перед установкой ваш собственный Google Chrome необходимо обновить: расширение speechpad работает лишь в последних версиях данного браузера.

Также очень желательно иметь собственный аккаунт Гугл. Завести его очень просто, для этого потребуется лишь действующий почтовый ящик. Лучше всего подойдет почта gmail, которая также является разработкой Гугл. Но если вы категорически не настроены иметь почтовый ящик с расширением gmail.com, можно использовать другой. Когда все готово, можно приступать к скачиванию программы.

Установка голосового блокнота

Найденная страничка будет иметь такой вид:

После установки (пара секунд) в меню возможностей Гугл появляется вот такая иконка:

Вот это смешной смайлик с открытым ртом и является нашей программкой. После его нажатия открывается информационная страница с описанием возможностей голосового блокнота:

Внизу этой странички имеется поле для работы с блокнотом.

Чтобы начать работу с голосовым блокнотом следует проверить собственный микрофон и нажать вот эту кнопку:

В поле 1 будет транслироваться онлайн запись вашего голосового сообщения. После окончания записи текст будет перенесен в поле 2, где его можно будет отредактировать стандартными средствами Word.

Начало работы

Итак, приступаем. Жмем «Включить запись». При правильно работающем микрофоне она загорается оранжевым цветом:

После отключения записи текст появляется в нижнем поле, и будет иметь такой вид:

Запятые и точки следует проговаривать, их алгоритм программы распознает «на звук» и ставит там, где это необходимо автору. Наше сообщение получило свой знак препинания после того, как было сказано слово «точка».

Если присмотреться, можно увидеть, что фраза написана с ошибкой: так алгоритм распознал речевое сообщение. Исправить ошибку можно собственными средствами блокнота или же после переноса текста на лист Office Word.

Как можно видеть, блокнот передает речевое сообщение достаточно правильно. А чтобы сработаться с программой на «отлично», следует выполнять несколько простых рекомендаций:

  1. Не спешите и старайтесь медленно и четко выговорить каждое слово.
  2. Если в первом поле текст завис – не спешите диктовать дальше. аплгоритм собьется, и предложение нужно будет диктовать заново. Лучше остановиться и дать программе возможность вас догнать.
  3. Откорректируйте работу микрофона так, чтобы он не записывал посторонние звуки – и ваше дыхание в том числе.
  4. Для редактирования текста лучше всего использовать поле 2. делать это следует после успешной записи каждого предложения. Выключать запись не нужно, но и слишком долгие паузы делать не следует: затяжная тишина может выбить запись полностью. После редактирования предложения или абзаца включайте запись для дальнейшей диктовки текста. Второй вариант – начитать текст полностью, а затем редактировать его средствами Word. Конечно, каждый выбирает собственный стиль работы. Попробуйте оба и выберите свой.

Знаки препинания – это отдельная медаль разработчикам.

Если выговаривать их четко и размеренно, то программа не спеша расставит точки, запятые, двоеточия и восклицательные знаки по вашей команде.

Голосовой блокнот на мобильном устройстве

Кроме стандартного использования голосовой набор текста можно использовать в любом мобильном устройстве. Для этого следует активировать свою учетную запись в Гул и скачать приложение прямо в браузер Хром. После этого при запуске хром на мобильном устройстве Speechpad будет включаться по первому запросу.

Попробуйте сами это замечательный сервис и поделитесь своими впечатлениями в комментариях!



 

Пожалуйста, поделитесь этим материалом в социальных сетях, если он оказался полезен!