Инструмент вывода речи из звукового потока

Разработана новая утилита для вывода текста из аудио в реальном времени (авто субтитры). Инструмент позволяет в реальном времени выводить текст на экран из звукового потока, который создается либо с помощью микрофона, либо берется из проигрываемого аудио или видео с помощью виртуального кабеля или стерео микшера.

В целом настройки инструмента достаточно очевидны.
настройки инструмента вывода речи из звукового потока
Переключатель Длина буфера фраз ограничивает максимальную длину распознаваемого куска текста и в большинстве случаев может быть установлен в максимальное значение — 300. Переключатель Защита от шумов не дает зависать распознаванию при наличии шумов в воспроизводимом аудио. При использовании микрофона он должен быть отключен.

Если вы не нашли нужного языка в списке Выбор языка для распознавания, то зарегистрируйтесь на сайте и добавьте нужный язык.

Запись опубликована автором в рубрике Без рубрики.

Инструмент вывода речи из звукового потока: 20 комментариев

  1. виктор

    как сделать этот стерео микшер? Или как сделать так чтобы был слышен звук через виртуальный кабель?

    1. admin Автор записи

      Стерео микшер для одних карт есть, а для других нет (там какая-то лицензионная ерунда). Я не знаю что надо делать, сам бы купил, наверное, звуковую карту (но у меня в одном компютере есть).

      1. виктор

        Проблема решена. Лучше всего не качать виртуальный кабель, а скачать драйвер RealTek High Definition Audio Codecs после чего появится стерео микшер

        1. admin Автор записи

          И что прям в записывающий устройствах стерео микшер появиться? (Я то вообще с ним игрался и у меня ничего не получилось)

  2. Михаил

    У меня тоже микшер не появился после установки RealTek Codecs. Windows 7.
    Виртуальный кабель встал нормально и появилась возможность перенаправлять потоки.

  3. Андрей

    Пробую режим вывода в буфер обмена.
    Скажешь что-нибудь, а потом очень долго нужно ждать, чтобы пикнуло. Где-то у вас тут на форуме прочитал, что дело в микрофоне. Это может быть, я говорю на микрофон ноутбука и, конечно, шумов вокруг предостаточно. Нельзя ли как-то запрограммировать команду, по которой бы всё, что наговорено, переносилось бы в буфер принудительно.
    Было бы классно придумать какую-нибудь кнопку, как на рации (например правый Ctrl), чтобы распознавание происходило только при этой нажатой кнопке. Нажал, сказал, отпустил кнопку — и сказанное в буфере обмена. Чтобы на трафике экономить. Окно поверх всех окон это здорово, но место всё-таки съедает.

    1. admin Автор записи

      Попробуйте внешний микрофон, микрофон ноутбука вообще говоря не подходит.

      1. Андрей

        Да я это понимаю, но всё-таки. Нельзя ли сделать голосовую команду для принудительного копирования распознанного в буфер обмена?

        1. admin Автор записи

          Флажок вывода в буфер обмена означает мгновенный вывод в буфер обмена после распознавания. Задержка не должна превышать 2 секунд. Если она больше, то это означает, что у вас не настроен микрофон (уровень, мал или наоборот велик), либо стоит флажок шумоподавления в настройках звуковой карты, либо очень плохой интернет, либо очень много шумов. В любом случае сначала нужно исправить ситуацию на вашей стороне.

          1. Андрей

            О, спасибо! Действительно, стояло подавление шума, убрал и всё стало хорошо. Там же в настройках есть «удаление постоянной составляющей». Это как-то ухудшает/улучшает работу?

          2. admin Автор записи

            нет, оставьте все остальное как есть

  4. Андрей

    Win 8.1
    Обнаружил следующее:
    1) Включаем запись в голосовом блокноте, всё идёт нормально.
    2) Выключаем микрофон через свойства звука. Блокнот ничего не слышит.
    3) Включаем микрофон через свойства звука. Блокнот по прежнему ничего не слышит.
    4) Отключаем запись в блокноте и включаем заново. Блокнот снова всё слышит.
    Тоже самое происходит при переключении на другое устройство записи, т.е. чтобы блокнот услышал новое устройство, блокнот нужно перезапускать.
    Можно ли как-то исправить эту особенность?

    1. admin Автор записи

      Андрей это к блокноту относится или к субтитрам в реальном времени? А для чего это нужно сначала микрофон отключать, а потом включать в настройках?

      1. Андрей

        Это относится к блокноту вообще.
        Отключать/включать микрофон можно же не только в настройках, а и программно. Тут не столько отключение/включение волнует, сколько умирание блокнота при переключении на другое устройство. Например, при подключении внешней гарнитуры с USB-свистком. Не проверял, но думаю, что и с блютуз-гарнитурами тоже самое будет.
        Как бы ничего страшного, но вот есть такое. Если не очень сложно отлавливать сообщение системы о переходе на другой источник звука, то было бы здорово.

        1. admin Автор записи

          Зависание скорей всего происходит в коде Гугла, иначе бы блокнот перезагружался

          1. Андрей

            А что, разве микрофон инициализирует код гугла? А как же тогда команды включить/отключить запись, их тоже код гугла отрабатывает? Тогда да. Я подумал, что не только интерфейс, а вся оболочка, кроме непосредственно распознавания, ваша.

          2. admin Автор записи

            Просто скорей всего программе не сообщается, что завис микрофон.

Добавить комментарий

Ваш e-mail не будет опубликован.