Закрепление окна блокнота над всеми окнами

28.02.2016. В голосовом блокноте теперь можно закреплять его окно над другими. Для этого нужно скачать и установить модуль интеграции и расширение блокнота, интеграция с OS при этом может быть не включена.

Флажок Показывать SpeechPad поверх окон находится в настройках расширения. Если его отметить, то вновь открытое окно блокнота будет расположено поверх других окон.

Настройка показа над всеми окнами

20.05.2015. Для ввода данных в офисные приложения на компьютере с помощью голосового блокнота его окно можно закрепить над всеми окнами. В Windows для этого можно использовать специальные свободно распространяемые программы: DeskPins (в восьмерке не работает), Windows Topmost control (работает в последних версиях Windows).

В Linux особой надобности в таких программах нет, так как закрепить окно можно средствами самой систем (надо щелкнуть правой кнопкой мыши на заголовке окна и выбрать пукт On Top).

Использование ярлыков Chrome для URL голосового блокнота с параметрами позволяет обеспечить независимость окна блокнота от остальных окон Chrome, в результате оно может работать как маленькая панель запуска и контроля состояния записи в режиме интеграции.

блокнот поверх остальных окон

Последние изменения в голосовом блокноте

Последние важные изменения в блокноте публикуются в твиттере. Подпишитесь на него и будете всегда в курсе.

07.09.2018. Небольшие изменения в дизайне блокнота — выделено поле имени файла.

23.08.2018. Разработано приложение голосового блокнота для iOS.

27.04.2018. Обновлено расширение. В версии 9.8 для комбинации включить/выключить запись по умолчанию установлена глобальная видимость (а не только в Chrome).

24.04.2018. Добавлены голосовые команды Пауза и Продолжить. Задать слова активации для этих команд (как, впрочем, и для других) можно на странице команд в кабинете пользователя.

30.10.2017. Введена новая настройка блокнота Пауза в речи. Настройка может быть сделана видимой на странице управления интерфейсом в личном кабинете пользователя. Настройка устанавливает величину паузы в речи, для срабатывания переноса текста в результирующее поле.

28.10.2017. В панель транскрибирования добавлен флажок «С коррекцией», который включает выравнивание границ временных интервалов (иногда следующий интервал налезал на предыдущий) при генерировании титров в формате Youtube.

18.09.2017. Добавлен пакетный режим транскрибирования файлов.

31.08.2017. На панель транскрибирования добавлены кнопки перемотки.

22.05.2017. Выпущена версия голосового блокнота для операционной системы Android.

17.03.2017. Полученный текст в инструменте субтитров в реальном времени теперь автоматически сохраняется.

19.01.2017. Добавлена кнопка Вырезать. Кнопка по умолчанию скрыта (нужно включить ее в настройках интерфейса). Вышла версия 9.0 расширения для учета этих изменений.

09.01.2017. Подключена автоматическая система включения расширенных возможностей блокнота при оплате. Включение теперь происходит в момент оплаты.

29.11.2016. Изменен формат меток времени (знаки для них) в результатах транскрибации.

21.11.2016 Настройка Число символов до перезагрузки теперь по умолчанию отключена и скрыта.

05.11.2016. Обновлен модуль интеграции с Linux. Исправлена серьезная ошибка в работе модуля.

29.09.2016. На панель транскрибирования добавлен ползунок управления скоростью воспроизведения.

Как обновить блокнот

Расширение обновляется автоматически. Скрипт на самом сайте обновляется, но вам может потребоваться обновить страницу на сайте по клавише Ctrl + F5, а то он кэшируется.

Модуль интеграции должен быть обновлен вами самостоятельно со страницы https://speechpad.ru/blog/windows-integration/». Для его обновления нужно скачать архив и просто заменить старый файл ru-speechpad-host.exe на новый.

Транскрибирование аудио файлов

Перевод аудио в текст в модуле транскрибирования основывается на подаче звука с колонок на микрофон. Это можно достичь либо, положив микрофон к колонкам, либо посредством аудио кабеля, как физического, так и виртуального. Можно также использовать стерео микшер.

Транскрибирование звуковых файлов длинной более 15 минут относится к расширенным возможностям блокнота. За них взимается небольшая плата. Чтобы попробовать или оплатить ее, нужно зарегистрироваться на сайте и зайти в кабинет пользователя голосового блокнота (появится оранжевая ссылка).

Панель перевода аудио в текст открывается после нажатия на кнопку +Транскрибацию на главной странице сайта.
панель транскрибирования

На приведенной картинке я обвел красным то что относится к этому модулю и перечеркнул, то что использовать вместе с ним не надо. То есть не нужно включать флажки вывод в буфер и интеграции. Поле Длина буфера фраз не дает накапливаться тексту в поле предварительного просмотра (актуально при использовании виртуальных или физических кабелей).

Переключатель Защита от шумов используется для борьбы с зависанием ввода в шумных видео.

Для загрузки видео с Youtube в модуль нужно ввести его ID.
загрузка ролика в панель

Транскрибирование может вестись в двух режимах, зависящих от установки флажка Запускать синхронно с записью. Когда этот флажок включен, то нажатие на кнопку включить запись одновременно включает проигрыватель, а остановить запись — останавливает его.

Весь алгоритм работы в этом случае заключается:
1) в загрузке ролика или файла в проигрыватель
2) обеспечению поступления звука с ролика на микрофон
3) Выставлению настроек, отметке флажка вставлять метки времени
3) нажатию на кнопку запуска.

Если флажок Запускать синхронно с записью не установлен то появляется панель задания времен паузы и работы.

панель пауза/работа

При таком режиме кнопка включить воспроизведение запустит проигрыватель в прерывистом режиме, то есть после 5 секунд (как задано на нашем рисунке) воспроизведения он будет останавливаться на 5 секунд паузы. Кнопка же включить запись от нее не зависит. Если время паузы и время воспроизведения не установлены, то работает просто кнопка включить/отключить воспроизведение.

Такой режим может быть использован для полуавтоматического транскрибирования. При этом режиме роль виртуального аудио кабеля играет человек — он прослушивает запись в течении времени воспроизведения и надиктовывает ее в течение времени паузы.

Обработка текста после транскрибирования

Текст получаемый методом распознавания речи содержит ошибки. Для его исправления используются метки времени, полученные при транскрибировании. В этом режиме нужно также отключить флажок запускать синхронно с записью или воспользоваться горячей клавишей запуска/останова проигрывателя для расширения блокнота.

Алгоритм исправления следующий:
1) текст с метками сначала приводится к более удобному виду последовательным нажатием кнопок метки в SRТ и SRT в метки
2) выставляется флажок запуск с меток времени
2) курсор устанавливается на нужное место текста
3) с помощью горячей клавиши или с помощью кнопки включить/выключить проигрыватель прослушивается данный кусок записи (срабатывает ближайшая слева от курсора метка времени)
4) вручную или при использовании кнопок блокнота редактируется текст
5) метки убираются нажатием на кнопку убрать метки времени, или текст приводится к формату SRT (если делаются титры для Youtube)

Пакетный режим транскрибирования аудио и видео файлов

Транскрибирование аудио и видео файлов в пакетном режиме (для более чем двух файлов) относится к премиум-функциям голосового блокнота. Как и расширенные функции они доступны после оплаты в кабинете пользователя. Чтобы попробовать этот режим нужно при загрузке аудио и видео выбрать сразу несколько аудио или видео файлов, удерживая при выборе мышью клавишу Ctrl.

Пакетный режим выбора файлов

Обращение в техническую поддержку

При обращении в техническую поддержку. Нужно прислать четыре скриншота:

1. Экран окна блокнота (можно сделать два скриншота, если не помещается)

2. Скриншоты вкладок записи и воспроизведения звука

3. Скриншот настройки микрофона в Chrome (chrome://settings/content/microphone)

Транскрибирование аудио в автоматическом режиме

Транскрибирование методом проговаривания

Ошибки и сложности при транскрибировании

Синхронный перевод в буфер обмена и в режиме интеграции

Установка флажков Вывод в буфер обмена и Интеграции с OS при включенном модуле синхронного перевода теперь приводит к выводу переведенной фразы, а не ее источника. Таким образом, можно общаться в сети на иностранных языках. Для облегчения включения этого режима можно воспользоваться URL с подготовленными параметрами, который включит синхронный перевод в буфер обмена и в режиме интеграции с русского языка на английский. Коды языков для голосового ввода передаются в параметре pagelang, а коды языка перевода передаются в параметре perlang.

С целью улучшения контроля в этих режимах, текст источника не стирается из результирующего поля.

Эффективная работа с голосовым блокнотом

Оборудование и интернет

Скорость и точность распознавания зависит от двух обстоятельств: качества и расположения микрофона и наличия неплохого интернета. Микрофон, который идет в комплекте с наушниками, располагается близко у рта, поэтому помех в нем меньше. Микрофон, вмонтированный в корпус компьютера, обычно не дает требуемого качества. Основные ошибки голосового ввода перечислены в статье блога.

Установка дополнительных компонентов

Для полнофункциональной работы блокнота должно быть установлено расширение, а для пользователей windows или linux — модуль интеграции с OS. Для запуска блокнота удобно создать ярлык Chrome.

Настройка интерфейса

Подробно настройка интерфейса описана в блоге. Обычно у меня включены следующие элементы:
рекомендуемые настройки интерфейса

Настройка голосовых команд

Работа с голосовыми командами проводится через модуль команд. На следующем примере добавлено три наиболее используемые голосовые команды.
задание голосовых команда

Список заменяемых слов

Заменяющие слова удобно использовать для ввода символов или пунктуации на другом языке. Рекомендуется установить псевдокоманду для ввода заглавных букв, как показано на следующем рисунке.
ввод заглавной буквы

Задание горячих клавиш

Горячие клавиши задаются на странице chrome://extensions/. Следует выбрать удобное сочетание и сделать настройку включения/отключения и открытия блокнота глобальной.
рекомендуемые настройки интерфейса

Рекомендуемый режим работы

Для качественной работы в блокноте нужно зарегистрироваться в нем, так как многие функции доступны только в авторизованном режиме. Для пользователей Windows целесообразным кажется следующий режим:
1. Установка и включение модуля интеграции.
2. Открытие окна блокнота через ярлык chrome или приложение Speechpad и минимизация его на рабочем столе или закрепление его поверх остальных окон как панель контроля записи в режиме интеграции. Включение отключение распознавания для пользователей десктопных версий через горячие клавиши, для пользователей планшетов: пуск через кнопку, останов — голосовой командой.

Где целесообразно использовать речевой ввод

Я применяю голосовой ввод в следующих случаях:

1. В поиске Yandex (рассписание электричек, и.т.д.).

2. В общении, ВКонтакте и других системах, когда задержка набора текста собеседником мешает нормальному общению.

3. При наборе нудного текста, думаю, что для набора лекций подойтет на все 5.

4. При общении на другом языке, даже если я его неплохо знаю. Вспоминать нужное слово бывает некогда.

5. При работе с нотбуком, например, письма мне там легче писать голосом.

Для пунктов 1, 2, 5 мною используется режим интеграции, пункт 3 делаю в самом блокноте, пункт 4 осуществляю с помощью режима интеграции вместе с синхронным переводом.

Подача команд с помощью голоса

Задание команд

В голосовом блокноте есть возможность подачи команд голосом. При отмеченном флажке «Выполнять команды» во время непрерывной диктовки можно подавать команды. В настоящее время распознаются следующие команды: «Отменить», «Сбросить», «Вырезать», «Копировать», «Выделить», «Удалить» , «Забой» , «Остановить», «Смена языка 1», «Смена языка 2», «Прописные буквы». Команды работают только в авторизованном режиме и только если для них заданы вызывающие их слова.

На странице модуля «Голосовые команды» — https://speechpad.ru/commands.php можно задать слова для вызова команд. Язык слов может быть любым из доступных в голосовом блокноте. Слова не обязаны совпадать с названием команды. Лучше всего выбирать для команды хорошо распознаваемые слова.

задание голосовых команд

Голосовые команды

Команда Отменить осуществляет сброс текста, который был направлен последним в результирующее поле. После чего непрерывная запись перезапускается.

Сбросить — сбрасывает надиктованный, но еще не попавший в результирующее поле текст. После чего непрерывная запись также перезапускается.

Вырезать копирует текст из результирующего поля в буфер обмена и одновременно очищает результирующее поле. Команда Вырезать работает только при установленном расширении голосового блокнота.

Команада Копировать. Копирует текст из результирующего поля в буфер обмена. Копирование возможно только при наличие расширения для голосового блокнота.

Команда Забой (backspace), работает как аналогичная кнопка в интерфейсе блокнота.

Команда Остановить аналогична нажатию кнопки «Остановить запись».

Команды Смена языка 1 и Смена языка 2 используются для выбора языка голосового ввода.

Команда Прописные буквы работает аналогично кнопке AA в интерфейсе блокнота и включает или выключает режим прописных букв.

Интеграция с операционными системами Windows и Linux

Ниже рассмотрена интеграция с OS Windows, интеграция с Linux рассмотрена в другой статье.

Что дает интеграция

Интеграция позволяет вводить текст напрямую в приложения Windows: Word, Excell, в браузерах (любых) и.т.д., то есть в любое место, где возможен ввод с клавиатуры. При этом окно Speechpad может быть минимизировано, а использование ярлыков chrome позволяют сделать это окно вообще независимым от других окон. Для использования режима Хром может даже не быть браузером по умолчанию.

Краткий вариант (для тех кто не любит заморачиваться)

1. Устанавливаем расширение с магазина Google Chrome.

2. Скачиваем модуль интеграции, распаковываем на рабочий стол и нажимаем на файл install_host.bat.

3. Регистрируемся в голосовом блокноте, вводим, полученный логин и пароль, нажимаем Войти.
Логинимся

4. Переходим в кабинет пользователя (ссылка появится) и
нажимаем там на кнопку Включить тестовый период.

5. Переходим вновь на https://speechpad.ru отмечаем флажок Интеграции с OS и нажимаем на кнопку Включить запись.

6. Открываем любое приложение, например Word, и диктуем в него.

7. Если вам понравилось пользоваться модулем интеграции, то делаем заказ на включение его на выбранный вами срок.

Вариант подлиннее

Начиная с версии 6.6 раcширения голосового блокнота, можно установить дополнительный модуль интеграции c Windows. Интеграция относится к расширенным платным услугам сервиса и доступна только в авторизованном режиме (когда пользователь вошел в систему). В настоящее время стоимость подключения расширенного режима сервиса составляет:
1 месяц — 100 руб.
3 месяца — 250 руб.
12 месяцев — 800 руб.

Для ознакомления с работой сервиса в расширенном режиме каждому зарегистрированному пользователю предоставляется бесплатный доступ на два дня. Бесплатно подключить услугу на это время, а также оплатить ее можно на странице профиля пользователя.

Установка модуля и подключение

Для установки модуля на компьютер нужно скачать zip архив (обновлен 01.06.2017) и распаковать его в папку на вашем компьютере (только не оставляйте его в папке download), затем запустить файл install_host.bat в этой папке. Для удаления программы (ну если не понравился) нужно запустить файл uninstall_host.bat и затем удалить папку.

Если теперь открыть голосовой блокнот, то флажок интеграции с OS станет доступен.

Установка флажка интеграции с Windows

Но рядом с флажком будет стоять слово выкл, показывающее, что услуга не включена.

Чтобы попробовать или оплатить интеграцию нужно войти в кабинет пользователя на страницу его профиля (cтраница профиля доступна после регистрации в сервисе). Для первичного ознакомления надо нажать кнопку Включить тестовый период.

Включение тестового периода

После этого в графе оплаченный период вместо нулей появится дата, до которой сервис будет доступен.

Дата отключения

Включать тестовый период можно только один раз. Дальнейшая работа возможна только после оплаты, кнопки которой находятся ниже на этой же странице.

Работа с модулем

Подключив услугу, переходим вновь на страницу блокнота и отмечаем флажок интеграции. Включаем запись. Теперь, если открыть какое-нибудь приложение Windows и начать говорить, то текст будет появляться в нем сразу после позиции курсора.

Для удобства непрерывного ввода текста в настройках расширения (для доступа к которым нужно щелкнуть на значке SpeechPad в правом углу браузера) есть переключатель выбора режима добавления пробела. Этот переключатель определяет спереди или сзади добавлять пробел к фразам.
Режим пробелов в интеграции

В статье об эффективной работе в голосовом блокноте даются рекомендации по использованию блокнота в режиме интеграции с OS.

Диагностика неисправностей при работе с интеграцией

Для работы интеграции должно быть выполнено три вещи
1. Вы должны быть «залогинены» и интеграция включена (то есть число должно быть рядом с флажком «интеграция с OS»)
2. Должно быть установлено расширение, если расширение установлено, то кнопка «Cкопировать» доступна.
3. Должен быть скачен и установлен модуль интеграции (установка заключается в запуске файла install_host.bat). Если расширение и модуль установлены, то флажок интеграции доступен.

Обращение в техническую поддержку

Если у вас есть проблемы с запуском интеграции, то вы можете обратиться за технической поддержкой.
При обращении, пожалуйста, пришлите скриншот с полным экраном браузера (должно быть видны оба верхних угла), на котором происходит ошибка. Также нужен скриншот запуска файла install_host.bat, расположенного в папке модуля интеграции.

Последние изменения

Добавлен голосовой ввод горячих клавиш.

Флажок Возобновлять при ошибках теперь отмечен по умолчанию и невидим.

Обновления архива

Пробная версия

26.05.2015 — добавлена обработка знака «возврат каретки»

07.06.2015 — компиляция с поддержкой устаревшей Windows XP

09.06.2015 — учет изменений в коде расширения

09.06.2015 21:08 — добавлена цифровая подпись

18.06.2015 — обработка команды «Забой»

Рабочая версия

19.06.2015 — убрано ограничение по дате (пробная версия работала до 21.06.2015)

11.10.2015 — исправлен баг, проявившийся в месенджерах Viber и Telegram

27.02.2016 — возможность установки окна SpeechPad поверх других окон

06.03.2016 — поддержка голосового ввода горячих клавиш в Windows

03.12.2016 — внесены изменения для корректной работы Chrome версии 55

04.12.2016 — модуль теперь работает для любых версий Chrome

01.06.2017 — обновление цифровой подписи

Голосовой ввод в планшете с windows 8.1

Microsoft в последнее время сделал серьезный прорыв на рынке мобильных устройств. При цене планшета, сравнимой и даже меньшей, чем аналогичные решения для Android, пользователь получает серьезную операционную систему (нормальные винды), да еще для некоторых устройств бесплатную подписку на офис 365. При этом все по-настоящему: для офиса работают макросы и код vba, для браузер Chrome — расширения (extension).

В отличие от устройствах на Android, в планшетах windows нет голосового ввода, зато прекрасно работает Speechpad вместе с его расширением.

работа расширения speechpad в планшете windows

Для вызова расширения следует подержать палец в нужном месте экрана — аналог нажатия правой кнопки мыши в десктопных версиях.

Небольшое предостержение для покупателей планшета — система виндовс достаточно сложная, поддержки в магазине вам скорее всего не окажут, инструкций тоже не дадут.

Помощь в работе с расширением для голосового блокнота

Назначение

Расширение голосового блокнота предназначено как для ввода текста в формах на сайтах, так и для ввода текста в различные приложения, используя буфер обмена операционной системы. Во-втором случае оно тесно взаимодействует с блокнотом, включая в нем возможность копирования в буфер обмена. В версии 6.6 добавлена интеграция с OS Windows и ввод текста может проводится напрямую в различные приложения.

Установка

Для установки расширения нужно перейти по следующей ссылке в магазине Chrome и установить его. Пользование им бесплатно.

Использование

После установки расширения, в контекстном меню Chrome (то есть в меню, показывающемся при нажатии правой кнопке мыши в окне Chrome) появится пункт Speechpad. Реакция на нажатие на этом пункт зависит от положения курсора мыши.

Если курсор был в редактируемом поле на веб сайте, то голосовой ввод будет производится непосредственно в это поле. При первом обращении к этой функции для сайта работающего по защищенному протоколу (https), и каждый раз для сайта, работающего по обычному (http) протоколу, во всплывающей панели вверху браузера будет нужно разрешить доступ к микрофону. После чего поле ввода станет розовым и в него начнется голосовой ввод. После окончания речи, цвет поля вернется к обычному. В версии 6.4 добавлена возможность длительного ввода в редактируемое поле. В этом случае для окончания ввода в поле нужно снова выбрать на нем пункт Speechpad.

прямой ввод в текстовое поле

Если курсор не был в поле редактирования, то откроется голосовой блокнот и автоматически начнется запись речи. В зависимости от установки флажков Вывода в буфер обмена и Интеграции с OS блокнот запустится с отмеченными опциями.

Использование горячих клавиш

Начиная с версии 5.9 расширения, появилась возможность использовать горячие клавиши для расширения..
Комбинация клавиш Ctrl+Shift+Z (Command+ Shift+Z для Mac) и Ctrl+Shift+X (Command+ Shift+X для Mac) включает прямой ввод в поле и ввод через буфер обмена соответственно. Комбинация клавиш Ctrl+Shift+7 (Command+ Shift+7 для Mac) включает или отключает распознавание речи в голосовом блокноте (равносильно нажатию на кнопку включить/отключить запись).

Чтобы поменять горячие клавиши нужно выйти на страницу chrome://extensions/shortcuts. При этом откроется окно установки горячих клавиш.

Установка быстрых клавиш

Настройка

Чтобы посмотреть и изменить параметры расширения нужно щелкнуть на значке Speechpad в правом верхнем углу браузера.

Настройки расширения

В диалоге настроек можно выбрать язык голосового ввода. Если языка нет в выпадающем списке, то можно ввести код языка в текстовое поле под списком. Коды языка чувствительны к регистру.

Флажок Продолжительное распознавание позволяет установить длительный ввод в поля редактирования.

Флажки установки вывода в буфер обмена и интеграции c OS используются при вызове голосового блокнота по правой кнопки мыши, и включают в нем нужный режим.

Установка флажка Показывать SpeechPad поверх окон закрепляет вновь открываемые окна голосового блокнота над всеми другими окнами. Эта настройка будет работать независимо от того используется ли в акаунте платный режим интеграции или нет.

Кроме того в настройках есть кнопка, которая управляет режимом добавления пробела при прямом вводе в приложения Windows.

Ввод аббревиатур голосом

В голосовой блокнот добавлена псевдокоманда для превращения следующей буквы в заглавную. В отличие от других команд, которые задаются в модуле задания команд кабинета пользователя, работа с псевдокомандами более похожа на работу со знаками препинания в модуле замены слов.

Созданная псевдокоманда имеет вид #1# и для ее использования в модуле замены слов (https://speechpad.ru/words.php) ей нужно присвоить заменяемое слово.

Присвоение псевдокоманды заменяемого слова

Первая строчка в списке на рисунке означает, что слово большая будет заменено на псевдокоманду, превращающую следующую букву в заглавную. Конечно, лучше придумать что-нибудь по замысловатей, так как заменеяемого слова мы в тексте не увидим (равно как и строки псевдокоманды).

Вторая строчка в этом списке используются для замены сочетаний вида: буква а на a, то есть сочетание буква + пробел заменяется на пустоту. Это связано с тем, что Гугл лучше распознает буквы в случае, если говорить буква а, чем проста a. Если посмотреть на ИД этих замен, то видно что сначала будет выполнена замена сочетания буква_, а потом псевдокоманда. В результате при произнесении фразы большая буква а мы получим А.

Предложенная псевдокоманда должна облегчить ввод аббревиатур и имен собственных, которые Гугл пока еше не всегда пишет с заглавной буквы.