Перевод аудио в текст без микрофона

Этот пост относится к переводу аудио в текст в модуле транскрибирования Speechpad.

Использование микшера

23.08.2014. Неожиданно обнаружил, что могу использовать для транскрибирования скрытые возможности в windows 7 и 8. Возможно это работает не всегда, но на двух моих компьютерах — старом нотбуке и новом моноблоке сработало. Последовательность действий следующая — открываем контрольную панель, затем выбираем звук и в ней вкладку записывающие устройства. Там нажимаем правую кнопку мыши и в появившемся контекстном меня выбираем — показать скрытые устройства.
показать миксер звука

Появится скрытый миксер звука. Делаем его доступным и затем устройстом записи по умолчанию.
сделать миксер устройстом записи по умолчанию

После этого напротив миксера появится столбик, означающий, что он используется для записи.
столбик рядом с миксером

И вроде все — можно приступать к переводу аудио в текст в модуле транскрибирования, при этом мы слышим звук из колонок и не нужно никаких повторителей.

Пользователь Виктор поделился опытом установки стерео микшера в случае если его нет в системе.

Использование виртуального кабеля

Нашел сегодня бесплатную замену программе Virtual audio cabel (VAC). Альтернатива почти свободно распространяется (там странная лицензия donationware) на сайте http://www.VB-CABLE.com.

Правда, предлагаемый там программа для повтора аудио у меня не заработала, но создать виртуальный кабель получилось и я смог распознать аудио без микрофона.

При переводе аудио с помощью программ, создающих виртуальный аудио кабель происходит неприятное явление — текст накапливается в поле предварительного просмотра и не попадает в результирующее поле. После порядка 5 минут распознавания программа отключается и высвечивается ошибка «error network». Так как ошибка находится вне кода блокнота, то просто исправить ее нельзя (правда можно обойти, например, выключением записи через некоторые промежутки времени).

От 07.11.13. Сделал принудительный перенос из предварительных результатов в результирующее поле при превышении длины текста 300 символов. Теперь проблема практически решена (17.12.2014 Теперь уже есть специальное Поле задания длины буфера фраз).

15.12.2013 Для сравнения привожу результаты транскрибирования mp3 2.5 минутного отрывка записи сказки Пушкина, скаченной с популярного сайта bibe.ru. Bite rate записи равнялся 128 kbps, колонки и микрофон самые обычные.

Результат перевода аудио с помощью колонок и микрофона
текст транскрибирования с помощью колонок

Результат перевода аудио с помощью программы VB-CABLE
текст транскрибирования с помощью виртуального кабеля

Настройка виртуального кабеля

1. Скачиваете виртуальный кабель, распаковываете его в папку и запускаете либо VBCABLE_Setup.exe, либо VBCABLE_Setup_x64.exe (в зависимости от разрядности вашей Windows)

2. Открываете окно управления записывающими устройствами и делаете CABLE Output устройством по умолчанию.
установка VB-CABLE, запись

3. Открываете окно управления устройствами воспроизведения и делаете CABLE Input устройством по умолчанию.
установка VB-CABLE, воспроизведение

4. Теперь можно приступать к транскрибированию. После этих манипуляций звук будет идти из выхода аудио на запись, микрофон при этом перестает работать. Чтобы вернуть его для работы нужно сделанные исменения откатить (вернуть все назад).

Использование физического кабеля

2.06.2014. Пользователь Владимир Гусев предложил использовать для транскрибирования кабель 3.5 jack- 3.5 jack. Один конец кабеля при этом вставляется в выход на колонки, а другой на вход для микрофона. Качество при этом методе получается близкое к качеству, полученному на vbcable, но нет неприятного эффекта накапливания текста в буфере предварительного просмотра. Для контроля звука он также предлагает использовать кабель с размножителем.

jack3.5 папа-папа
jack3.5 папа-мама

Транскрибирование аудио в Linux

Для Linux организация виртуального кабеля делается средствами самой операционной системы. По крайней мере мне в Ubuntu ничего устанавливать не пришлось. По-моему, я не использовал терминала даже, работал только через графическую оболочку.

Стерео микшер в Mac OS

Для организации стерео микшера в Mac OS можно использовать последнюю версию soundflower.

Запись опубликована автором в рубрике Без рубрики.

Перевод аудио в текст без микрофона: 85 комментариев

    1. admin Автор записи

      Да пробовал, иначе бы не писал. Устанавливаете программу и у вас появляется в playback device CABLE Input, а в Recording device — CABLE Output. Делаете их по умолчанию (SET a default device), после чего звук идет на запись, минуя микрофон и колонки.

  1. Alex

    А при использовании этой программы какой должна быть максимальная длительность аудиозаписи, просто у меня 3 часа идет запись, если нужно поделить то по сколько минут нужно делить и как это сделать? P.S.Спасибо за сайт, очень полезный.

    1. admin Автор записи

      Я бы сначала дал 3 минуты и если качество меня бы устроило, то отключил бы через 20 минут и посмотрел снова и так далее. Если плейер аудио подымает, то делить не нужно, блокнот работает со звуком, а не с файлом.

        1. admin Автор записи

          Это не мое видео. И кстати о какой программе идет речь? Если о VAC, то она платная и я ее не использую.

          1. Alex

            Уважаемый admin. Последний вопрос если позволите, есть ли ограничение количества символов при диктовке через микрофон?

          2. admin Автор записи

            Как такового лимита у поля textarea скорей всего нет, но думаю что превышения 64кбайт может иметь неприятные последствия, хотя не пробовал, во всяком случае сохранить такое поле не удастся.

      1. Elena

        Здравствуйте,
        Включила тестовый режим на два дня, который, в теории, позволяет пользоваться расширенными возможностями. Пытаюсь транскрибировать файл больше 15 минут, с метками и без, и все равно блокнот не транскрибирует больше 15 мин, и выводит соответствующее сообщение.
        Так как же его убрать и за один раз транскрибировать один час, например? Заранее спасибо за пояснения, не нашла информации ни о каких дополнительных манипуляциях. А время-то ограничено, как в тестовом, так и в платном варианте, и оно идет…

  2. Галина

    Планы на блокнот большие… Попробовала транскрибацию, видео с ютюба прекрасно загрузилось, но запись аудио не получилась. Ладно, попробовала записать своим голосом с микрофона, язык испанский, включила испанский, но… разочарование…
    не пишет… пишет слова похожие на русские и на русском языке, а испанские нет…
    Такие у меня надежды были и ничего не получилось… Может быть что — то в настройках нужно поменять? У меня версия блокнота 5.2

    1. admin Автор записи

      Галина, язык нужно установить в блокноте, там есть выпадающий список. У блокнота версий нет (это сайт), версии есть у расширения, на сайте оно роли не играет. Транскрибирование очень сильно зависит от качества записи и от дикции говорящего, как правило большинство роликов и записей этому требованию не удовлетворяют, но может повезти.

      1. Галина

        Я разобралась. В выпадающем списке я все правильно сделала, выбрала испанский. Сегодня я снова попробовала и ничего не получилось, но я же лох и поэтому попробовала все кнопочки исследовать. Нажала на кнопочку «перевод» и, (о, чудо) получила испанский с голоса. Вот ведь, воистину: «Ищите и обрящете». Не мытьем, так катаньем. С транскрибированием буду разбираться. Может быть на форуме помогут? Попробую программку установить «без микрофона». Спасибо большое!!! Я уже наговорила целую лекцию, которая была в аудио формате. Получилось быстрее, чем слушать и набивать на клавиатуре. Очень ВЫ мне помогли, думаю дальше будет еще интереснее, да и работа продуктивнее…..

        1. admin Автор записи

          Добрый вечер Галина. Кнопка перевод вообще-то нужна, только для того чтобы перевести на другой язык. Так что в следующий раз можно ее не нажимать, испанский с голоса будет все-равно идти.

  3. Галина

    И еще я поняла, что качество микрофона имеет важное значение. Мне подарили профессиональный, разница чувствуется…

    1. admin

      Галина, видео yutube не стартовало, я это поправил сейчас (были изменения в youtube и я их не отследил)

  4. vlas

    Добрый день, Вы не могли бы все же подробнее, желательно пошагово описать использование виртуального кабеля? Поставил его, сменил устройства по умолчанию (вход и выход) в настройках звука на кабель. Вот с этого момента — неясно, что делать дальше. Запускаю файл (mp3, 64 kbps) в винампе, включаю запись в голосовом блокноте, но эффекта нет. Пытаюсь включить файл во встроенном плеере (панель транскрибации) и пустить запись — то же самое, текстовые поля остаются чистыми. звука при этом, понятно, не слышу, т.к. аудиокарточка отключена — вместо нее по умолчанию кабель. Мне кажется, я не понимаю какой-то принципиальной вещи, но какой? Спасибо!

    1. admin Автор записи

      Ok. Давайте по-порядку.
      1. Проверяем работу модуля транскрибирования с использованием колонок и микрофона.
      1.1. Выбираем mp3 кнопкой выбора файлов
      1.2. Кладем микрофон к колонкам
      1.3. Нажимаем кнопку «Включить запись», кнопка становится рыжей, автоматически включается воспроизведение и текст начинает появляться в полях.
      2.Проверяем с использование VB-CABLE
      2.1. Устанавливаете его как устройство по умолчанию для recording и playback (см. картинку в посте).
      2.2.Выбираем mp3 файл
      2.3. Аналогично 1.3.

      1. vlas

        Большое спасибо! С колонками проверить, к сожалению, пока не могу — их нет у меня. Пытался наушники на полной громкости к микрофону приложить — не воспринимает. Но с кабелем я так и делал, как у Вас описано, что-то не фурычит.. Очевидно, проблема индивидуальная. Если решу ее — отпишусь. А так, через микрофон все работает как надо, пользуюсь и благодарен за сервис)

  5. Артур

    Спасибо, разобрался.
    Возникает вопрос: а что поможет улучшению качества обработки голоса? Имею ввиду убирание шумов, повышение высоких частот голоса и т.д. в специальной программе.

  6. Марина

    Спасибо огромное за данный ресурс — вещь просто архинужная. Однако для начала нужно разобраться что к чему. Во-первых перешла по указанной вверху ссылке — скачать программу не удаётся (кнопочка скачать жмакается — реакции никакой). Попробовала вариант со скрытыми возможностями винды (у меня семёрка). Залезла куда положено, но вместо того, что описано 23.08.2014, у меня две возможности открываются правой кнопкой мыши: показать отключённые устройства и показать отсоединённые устройства. Обе галочки поставила, но ничего из описанного не появилось. Может есть какие соображения как преодолеть эту проблему?

    1. admin Автор записи

      Зашел сегодня на http://vb-audio.pagesperso-orange.fr/Cable/index.htm и кнопочка download прекрасно жмакается (оранжевая такая внизу). Но всегда есть два железных варианта колонка и микрофон или аудио кабель. Миксер у меня тоже работал на 2 из 3 компьютерах (видимо дело в драйверах).

  7. Марина

    Кабель установить получилось, а также сделать его устройством записи по умолчанию. Однако транскрибация не идёт. Во первых: Закачала файл и при воспроизведении я слышу звук, а этого как я понимаю, быть не должно. Во вторых у меня в голосовом блокноте нет знака микрофона (не знаю как правильнее сказать кнопка или пиктограмма), хотя при первом входе и нажимала разрешить (при этом голосовой поиск в хроме работает). Приложения и расширения тоже вроде бы все установлены. Подскажите пожалуйста, какие могут быть проблемы и что можно сделать. Заранее благодарна.

    1. admin Автор записи

      Там в комментариях было написано: Устанавливаете программу и у вас появляется в playback device CABLE Input, а в Recording device — CABLE Output. Делаете их по умолчанию (SET a default device), после чего звук идет на запись, минуя микрофон и колонки. То есть кабель не только устройством записи, но и устройством воспроизведения по умолчанию. В голосовом блокноте давно не знака микрофон (убран), все управление делается кнопкой «включить запись».

  8. Иван

    Уважаемый Admin,
    Eсть ноут I5 со встроенным микрофоном и WEB-камерой под Windows 8.1. При записи файлов mp3 с плеера (VLC , WMP) в Блокнот непосредственно (без VB-CABLE и др.) все работает, пишет. Но кроме основного текста пишет посторонний текст.

    Пример записи:
    Lifehouse i want to play soccer двойной системе 11000000 xml file to comprise как научиться break dance таймвеб хостинг sd.tom.ru в каком месте ты у меня в ад мотоцикл в минске на дискете милицию.

    В плеере в это время звучит английский текст, который я запустил. Начало Примера из этого текста. Иногда все идеально. Как такое может быть? Откуда лезет? Как избавиться?

    1. admin Автор записи

      Иван, спасибо за комментарий. Видимо, на главной странице не хватает текста: Голосовой блокнот не работает с внутренним микрофоном ноутбука и нельзя использовать внутренние колонки ноутбука для транскрибирования.

  9. наталья

    Уважаемый Admin.! А можно ли эту программу использовать для перевода аудио файлов в фильме в текстовые титры? (Я понимаю, что при этом, надо весь аудио материал разбивать на отдельные фрагменты, т.е. это и будут титры ).

    1. admin Автор записи

      В программе есть возможность генерировать титры для ютюб в формате srt, в общем этот процесс мало отличается от генерирования титров для фильма.

  10. Светлана

    Добрый день!
    1. Нужно ли дополнительно выставлять параметры для CABLE Input и CABLE Output, например регулировать уровни, громкость и пр., имеет ли это значение?
    2. Часто из поля записи фрагмента в результирующее поле расшифровка не переносится, просто пропадает.
    3. Результирующее поле имеет ограничение? Текст пишется до заполнения его…

    1. admin Автор записи

      1. Голос распознается обычно при разных уровнях, главное чтобы не совсем мало и не очень много (зашкаливало)
      2. Видимо уровень достоверности был настолько мал, что просто пропустил этот фрагмент
      3. Результирующее поле скорее всего ограничено просто правилами html, но я бы не рекомендовал работать с длинной больше 64 кб

  11. Иван

    подскажите ставлю видео на транскрибацию через примерно 2 минуты начинает снова с нуля играть с чем это связано?

  12. Аноним

    Огромнейшее спасибо! Без вас, ну никак! И в рамблер подтверждение ждала, и браузер не тот, и микрофон в командной строке был отключен, и кабеля не оказалось, скрытый микшер выручил! А с вами даже я «чайник» теперь видео могу в текст перевести! РЕСПЕКТ!

  13. Константин

    Заметил один бзик в работе программы. При транскрибации видео с ютюба, через скрытый микшер или через вирткабель в момент перескока текста из малого окна в большое, транскрибация замирает на 2-3 секунды, а видео в это время идёт и из — за этой паузы «теряется» два-три слова текста. Хотелось бы узнать, какая такая причина может так тормозить программу .

    С другого видео, где лектор разговаривает помедленнее и с паузами, перескок текста идёт нормально.

    1. admin Автор записи

      Там немного по-другому происходит. Когда длина фраз в буфере предворительном превосходит заданное значение (переключатель можно сделать видимым, а по умолчанию там 300 символов) происходит искуственный сброс из поля предварительного просмотра в результерующее. Во время этого сброса возможна потеря некотрых слов на границе. Буфер переполняется обычно при использовании виртуального кабеля и невнятной дикции. В принципе, можно было бы немного возвращать назад, но тогда дубли будут.

        1. admin Автор записи

          В данном случае я спрашиваю у вас, стоит ли пытаться промотать немного назад (секунды на две, три) или это будет только мешать?

  14. Галия

    Закачала виртуальный кабель , а как распаковать и запустить не знаю . Поскажите !

    1. admin Автор записи

      Читайте внимательно инструкцию, программа бесплатная, транскрибирование. Индивидуальной поддержки не предусматривается.

    1. admin Автор записи

      Пришлите скриншот и напишите какой браузер и какой виртуальный кабель вы используете.

  15. Вадим

    … Скачал vbcable по вашей ссылке,скачалось архивом — при попытке установки пишет — «vbcable installation error»… Что дальше сделать?!..

    1. admin Автор записи

      vbcable не моя программа, поддержкой ее не занимаюсь. Если не получается- ставьте микрофон у колонок

  16. Екатерина

    Здравствуйте! При транскрибации с youtube error: language-not-supported
    видео на английском вкладка тоже на английский выбрана

  17. Михаил

    Спасибо за подробную инструкцию. Вопрос вот такой: возможна ли транскрибация не-MP3 файлов? Другими словами есть некие видео в специальном формате и есть проигрыватель для этого формата. Конвертировать в MP3 пока не получается. Можно ли с помощью виртуальных или не виртуальных кабелей использовать SpeechPad для такого видео?

    1. admin Автор записи

      В принципе блокноту все-равно откуда звук идет, единственно он при ошибках не сможет останавливать чужой проигрыватель.

        1. admin Автор записи

          Снимите флажок — Запускать синхронно с записью и ничего не выбирайте. А можно вообще просто в блокноте, не открывая модуль транскрибирования.

  18. Роман

    Установил vbcable но не могу найти на компьютере панель управления им. В файла скачанных с сайта разработчика есть файл VC CABLE CONTROLPANEL запуская его открывается окно совсем не такое как в видео уроке. Подскажите возможную проблему.

    1. admin Автор записи

      Я не использовал и не открывал эту панель. Просто установил (нажал на setup) драйверы. В звуковых настройках после этого появляются кабели как устройства.

  19. Привет

    Здравствуйте, тут еще можно задавать вопросы. Не получилось у меня преобразовать английскую речь из мр3 в текст тоже английский .Срочно нужно

    1. admin Автор записи

      Посмотрите видео об ошибках транскрибирования. Обратитесь в поддержку.

  20. Ольга

    Здравствуйте, возникла проблема с микшером, но «выручил» виртуальный кабель, но всеравно полученный текст скорее набор слов (даже не из лекции) хотя при прослушивании то что говорит лектор вполне возможно услышать. Подскажите пожалуйста что можно сделать чтобы поправить положение.
    И ещё, подскажите пожалуйста какие характеристики лучше всего выставлять на диктофоне для последующей транскрибации текста (возможно в этом и есть проблема).

    1. admin Автор записи

      Здравствуйте. Вы может либо воспользоваться временными метками и вручную делать транскрибацию, либо еще раз сделать ее методом проговаривания. Про диктофон ваш ничего сказать не могу пробуйте сами. При транскрибировании думаю, что защиту от шумов надо в этом случае ставить (время перезагрузки) и следить за уровнем звука.

  21. Оксана

    Добрый день. Может быть кто-то подскажет, почему на планшета при голосовом вводе одно слово дублируется, т.е. печатается 4-5 раз?

    1. admin Автор записи

      На андроиде пока не работает (там на планшете у вас андроид наверное)

  22. Ольга

    Здравствуйте! Скажите, через хром на Маке должно работать? к сожалению, текст не появляется. Спасибо!

  23. abyrvalG

    Бобр бобр!
    1. Спасибо за программу; она понимает мой английский, немецкий, русский вот даже; запятые с восклицательными и даже точку с запятой! Я прямо аж — як казали стародавні японці — ja okchuevlyon!
    2. При попытке транскрибировать из ютубовского видео выдаёт error: no-speech.
    Зарегистрировался, нажал «тестовый период», снова пробую — error: no-speech.
    Воткнул аудио-выход с видеокарты в разъём микрофона; система видит входящий звук, но — error: no-speech.
    Xubutnu 16.04.3, PulsAudio.

    1. admin Автор записи

      Тестовый период ни при чем, он влияет только на интеграцию и максимальное время транскрибирования. Об организации микшера в Linux — https://vk.com/speechpad?w=wall-37701517_690 (автор там пишет о консольной команде, но можно и без нее) Попробуйте сначала просто микрофон положить у колонок — должно и так плохо, но работать.

    1. admin Автор записи

      Я только что загрузил его, там написано что win10 поддерживается. А вообще лучше стерео микшером, если он в системе есть пользоваться.

      1. кабель настроил

        виртуальный кабель настроил. но кнопка интеграция с ОС так и не нажимается. но текст пишется в маленьком окне а в большое не переносит почему то

        1. admin Автор записи

          Интеграция совсем не нужна для транскрибирования. А виртуальный кабель не нужен для интеграции.

      2. кабель настроил

        все норм. предыдущие комменты можно удалить. если вы не против)))

        самое главное для виртуального это было разархивировать на диск (именно на диск!!!) и установить от имени администратора.

        флажок на синхронизации так и не нажимается, но все записывает. достаточно годног все работате. и как я понял надо покупать верстю за 300 рублей, чтобы видео транскрибировать или хватит версии за 100?)

        благодарю за терпение и понимание!!

        1. admin Автор записи

          Чтобы флажок интеграции нажимался нужно установить расширение и модуль интеграции. Но он (флажок) вам не нужен для транскрибирования. Версия по 300 это пакетный режим и если вы не намерены сразу много файлов транскрибировать, то оно вам и не нужно.

  24. svetlana

    Добрый день!

    Интересует такой вопрос : Транскрибация с помощью данной программы не происходит с хинди-языка?

    И если -нет, то подскажите пожалуйста программу , которая поможет мне в этом? Интересует именно хинди язык.

  25. ruslan

    Настроил виртуальный кабель, работает. Но я не слышу звука. А он нужен (на лету буду текст смотреть). Какие есть выходы из этого?

  26. Татьяна

    Сделала транскрибацию аудио, в текст, если не исправлять по ходу текст на выходе, прочесть потом невозможно. Набор слов, окончания слов коверкает, жуть жуткая, бред полный…..

    1. admin Автор записи

      Для некоторых бред, для некоторых нет. Все зависит от исходного аудио.

  27. aleksandrt

    Здравствуйте! Поскольку микшера нет, пришлось скачать и подключить виртуальный кабель. Но он кажется не подключился. В свойствах пишется. что «Нет данных о гнезде подключения»ю И микрофон, судя по индикации работает, хотя я с него снял галку.

Добавить комментарий

Ваш e-mail не будет опубликован.