Инструмент вывода речи из звукового потока

Разработана новая утилита для вывода текста из аудио в реальном времени (авто субтитры). Инструмент позволяет в реальном времени выводить текст на экран из звукового потока, который создается либо с помощью микрофона, либо берется из проигрываемого аудио или видео с помощью виртуального кабеля или стерео микшера.

В целом настройки инструмента достаточно очевидны.
настройки инструмента вывода речи из звукового потока
Переключатель Длина буфера фраз ограничивает максимальную длину распознаваемого куска текста и в большинстве случаев может быть установлен в максимальное значение — 300. Переключатель Защита от шумов не дает зависать распознаванию при наличии шумов в воспроизводимом аудио. При использовании микрофона он должен быть отключен.

Если вы не нашли нужного языка в списке Выбор языка для распознавания, то зарегистрируйтесь на сайте и добавьте нужный язык.

Запись опубликована автором в рубрике Без рубрики.

Инструмент вывода речи из звукового потока: 10 комментариев

  1. виктор

    как сделать этот стерео микшер? Или как сделать так чтобы был слышен звук через виртуальный кабель?

    1. admin Автор записи

      Стерео микшер для одних карт есть, а для других нет (там какая-то лицензионная ерунда). Я не знаю что надо делать, сам бы купил, наверное, звуковую карту (но у меня в одном компютере есть).

      1. виктор

        Проблема решена. Лучше всего не качать виртуальный кабель, а скачать драйвер RealTek High Definition Audio Codecs после чего появится стерео микшер

        1. admin Автор записи

          И что прям в записывающий устройствах стерео микшер появиться? (Я то вообще с ним игрался и у меня ничего не получилось)

  2. Михаил

    У меня тоже микшер не появился после установки RealTek Codecs. Windows 7.
    Виртуальный кабель встал нормально и появилась возможность перенаправлять потоки.

  3. Андрей

    Пробую режим вывода в буфер обмена.
    Скажешь что-нибудь, а потом очень долго нужно ждать, чтобы пикнуло. Где-то у вас тут на форуме прочитал, что дело в микрофоне. Это может быть, я говорю на микрофон ноутбука и, конечно, шумов вокруг предостаточно. Нельзя ли как-то запрограммировать команду, по которой бы всё, что наговорено, переносилось бы в буфер принудительно.
    Было бы классно придумать какую-нибудь кнопку, как на рации (например правый Ctrl), чтобы распознавание происходило только при этой нажатой кнопке. Нажал, сказал, отпустил кнопку — и сказанное в буфере обмена. Чтобы на трафике экономить. Окно поверх всех окон это здорово, но место всё-таки съедает.

    1. admin Автор записи

      Попробуйте внешний микрофон, микрофон ноутбука вообще говоря не подходит.

Добавить комментарий

Ваш e-mail не будет опубликован.