Панель транскрибирования

Материал в статье устарел. В настоящее время используется расширение 3.0

В голосовой блокнот добавлена панель транскрибирования, то есть перевода звука из аудио и видео файлов. Для работы с панелью транскрибирования нужно:

  • скачать модуль поддержки транскрибирования
  • распаковать его на своем компьютере и проверить, что внутри папки находятся файлы, а не другая папка (это зависит от опции разархивирования)
  • набрать в поле адреса chrome строку — chrome://flags и включить опцию API экспериментальных расширений
    включение опции экспериментальных расширений в chrome
  • нажать на этой вкладке кнопку Перезапустить chrome
  • загрузить расширение speechpad в качестве распакованного расширения для Chrome. Для этого можно ввести в адресную строку Chrome — chrome://chrome/extensions и перейти на вкладку установки расширений для Chrome. На вкладке отметить флажок developer mode и затем нажать на кнопку Загрузить распакованное расширение.
    установка расширения транскрибирования для speechpad.ru
  • Качество полученного текста во многом зависит от качества аудио в записи, а также от аудио системы, так как звук в микрофон поступает из колонок. Для улучшения работы аудио системы возможны нестандартные подходы, как-то использование наушников и.т.д.

    Буду рад вашим замечаниям и предложениям по новым возможностям голосового блокнота.

    от 16 ноября 2012. Начал сам тестировать транскрибирование.
    Во-первых, выяснилось, что очень важно качество звука, то есть это самое число на 1 с. Звук из youtube очень плохо распознается как-раз из-за низкого качества. Для улучшения распознавания лучше всегда ставить HD качество в настройках ролика.

    от 7 декабря 2012. Панель транскрибирования можно использовать для непрерывного ввода текста с микрофона, если не загружать файлы, а просто нажать на кнопку включить. При достаточных навыках можно осуществлять редактирование текста прямо по ходу диктовки.

    от 8 декабря 2012. Видимостью элементов на панели транскрибирования теперь можно управлять в настройках интерфейса личного кабинета.

Кабинет пользователя голосового блокнота

В голосовой блокнот добавлена возможность регистрироваться в кабинете пользователя. В настоящее время зарегистрированным пользователям доступны сохранение и загрузка текстов, а также функция создания пользовательских терминов.

Функция сохранения и загрузки текстов позволяет использовать речевой блокнот в качестве голосовой записной книжки — для каждой записи можно задавать произвольное имя, записи можно удалять и редактировать.

Термины можно использовать следующим образом. Например, если приходится наговаривать одну и туже фамилию, а ввод собстенных имен плохо работает с голоса, то можно ввести новый термин с именем — фамилия 1 и поставить ему в соответствие словосочетание «Василий Петров». Если произнести теперь фамилия один, то появится текст «Василий Петров». Текст заменяемого слова должен быть написан строчными буквами. Функция работает при включенном флажке «Заменять слова пунктуации».

Обновление 08.08.2012 — в кабинете пользователя теперь можно менять пароли.

Обновление 17.08.2012 — добавлена авторизация через Яндекс. При нажатии на кнопку «Яндекс войти» идет перенаправление в Яндекс, где пользователь должен подтвердить разрешение использовать данные из акаунта Яндекс (не пароли конечно). Программа при первом входе создает учетную запись c именем пользователя и email, взятым из Яндекса.

Обновление 22.08.2012 — изменения в интерфейсе пользователя блокнота. Поясняющий текст убирается для зарегистрированных пользователей.

Ждем ваши комментарии и предложения по новым функциям блокнота.

Расширение для голосового блокнота

Сделана отдельная обновляемая страница помощи по текущей версии. На 01.10.2014 это версия 5.9. В версии 5.9 добавлены горячие клавиши и улучшена работа с электронными таблицами Google.

28.07.2014. Вышла версия 5.8 расширения. В этой версии выбор пункта Speechpad в контекстном меню chrome вместо октрытия нового окна, открывает блокнот в новой неактивной вкладке браузера и автоматически включает режим вывода в буфер обмена.

30.07.2013. Вышла версия 4.5 расширения. В ней добавлена панель настройки языка голосового ввода. Настройка осуществляется на странице chrome://extensions/ нажатием на ссылку настройка.
. После чего открывается диалоговая панель настройки языка .

07.06.2013. Вышла версия 4.1 расширения. Язык при прямом вводе в поле теперь определяется на основании установок языка в Chrome.

26.05.2013. Вышла версия 4.0 расширения. В ней усилены возможности ввода в текстовые поля на сайтах.

Расширение для голосового блокнота версии 3.0 позволяет вводить текст напрямую в текстовые поля. ввод текста голосом в социальной сети В Контакте Следующий пример показывает ввод текста голосом в сети «В Контакте»

Устанавливается расширение автоматически и бесплатно из Каталога приложений Google. Для этого нужно перейти по предложенной ссылке и нажать на ссылку «Установить» в правом углу.

Если вы ставили до этого расширение версии 2.0, то его нужно сначала удалить. Для этого наберите в строке URL Chrome «chrome://extensions» или перейдите через меню Chrome, нажав на пункты: Инструменты->Расширения, на страницу расширений. Удалите расширение Speechpad 2.0, нажав на иконку корзины рядом с расширением.

Расширение работает только в браузере Chrome. После установки расширения можно будет нажимать правой кнопкой в любом поле ввода и выбирать пункт
Speechpad—>Start voice input.
После чего произносимый в микрофон текст будет напрямую поступать в поле ввода.

Компактный вид голосового блокнота

В голосовой блокнот добавлена кнопка смены вида: «обычный/компактный». При переходе в компактный вид все ранее выбранные настройки в обычном виде сохраняются («Добавлять по месту курсора», «Начинать предложение с заглавной»), но некоторые элементы управления убираются.

При компактном виде результирующее поле уменьшается в размерах вместе с окном. Режим может быть полезен для заполнения комментариев и других полей голосом.

Ваши отзывы и рекомендации по улучшению этой новой возможности будут очень нужны.

Обновления голосового блокнота

Здравствуйте дорогие пользователи! В ходе совместной с вами работы над усовершенствованием голосового блокнота в него были добавлены следующие изменения: активация и добавление голосового ввода с клавиатуры; сделана перестановка кнопок, улучшающих Юзабилити; добавлена возможность вводить текст напрямую в результирующее поле. Кроме того, теперь можно вводить тект на иностранных языках.

Изменения голосового блокнота от 15.05.2012

Добавлена кнопка отмены последнего речевого ввода. Добавлен флажок «Начинать с заглавной», если он отмечен, то первая буква фразы автоматически делается прописной.

Изменения голосового блокнота от 24.05.2012

Программа радикально изменена. Убрана кнопка добавить. Текст поступает сразу в результирующее поле. Добавлен флажок «Добавлять по месту курсора». Если флажок установлен, то текст поступает в место курсора в результирующем поле. Если в результирующем поле было сделано выделение, то введенный текст его заменяет. Увеличено поле с микрофоном, перекомпонована страница.

Изменения голосового блокнота от 26.05.2012

Добавлена возможность вводить некоторые символы и знаки препинания голосом. Так например, если во входной речи будет слово «открыть кавычки», то оно будет заменено на отрывающую кавычку (то есть кавычку перед которой есть пробел, а после нет).

Изменения голосового блокнота от 5.06.2012

Флажок «Начинать с заглавной» заменен на флажок «Начинать предложение с заглавной», который делает первую букву речевого ввода прописной, если до этого в результирующем поле идет точка, восклицательный знак, вопросительный знак или знак начала абзаца.

Если вы заметили какие-то неудобства в работе или имеете предложения по новым функциям, то теперь открыта группа В Контакте по голосовому вводу, надеюсь на наше с вами дальнейшее сотрудничество.

Ресурсы по голосовому вводу

Спецификация по API для голосового ввода на javascript, предложенная Google

Проект требований для HTML для реализации голосового ввода

Архив почтовой рассылки группы web speech API

Блог по технологиям Google Chrome

Официальный блог по браузеру Chrome

Закачка Бета версии Chrome

Поиск по всем группам (форумам) по проекту chromium

Поддержка Web speech API в браузерах.

Статья, объясняющая работу голосового ввода (на английском).

Демонстрация работы web speech api от Google

Активация голосового ввода с клавиатуры

Статья устарела, в настоящее время в программе есть горячие клавиши для запуска голосового ввода

Голосовой ввод может быть активирован не только нажатием на значок микрофона, но и специальными клавишами для MAC и Windows. Кроме того в большинстве операционных систем есть функции специальных возможностей, позволящие делать альтернативный ввод для мыши и клавиатуры. В операционной системе Windows XP-Windows 7 эти настройки можно найти в панели управления во вкладке «специальные возможности — управление мышью с клавиатуры». При настройке управлении мышью с клавиатуры вместо щелчка можно будет использовать клавишу «5» на цифровой клавиатуре. Будьте внимательны, нажатие на другие клавиши цифровой клавиатуры в этом режиме могут изменить режим эмуляции, для сброса этих изменений используйте клавишу «/» .

Инструкция по активации ввода с помощью эмулирования клика

  1. Установить курсор мыши на значок микрофона
  2. Нажатием на клавишу 5 проводить активацию голосового ввода

Презентация речевого блокнота

Буду рад, если блокнот понравится. Надеюсь на сотрудничество — все замечания и пожелания по работе блокнота буду, по возможности, оперативно внедрять.

p.s. В голосовой блокнот можно вводить записи и на английском языке. Для этого надо нажать на флаг соответствующего языка (английского).