Этот пост относится к переводу аудио в текст в модуле транскрибирования Speechpad.
Использование микшера
23.08.2014. Неожиданно обнаружил, что могу использовать для транскрибирования скрытые возможности в windows 7 и 8. Возможно это работает не всегда, но на двух моих компьютерах — старом нотбуке и новом моноблоке сработало. Последовательность действий следующая — открываем контрольную панель, затем выбираем звук и в ней вкладку записывающие устройства. Там нажимаем правую кнопку мыши и в появившемся контекстном меня выбираем — показать скрытые устройства.
Появится скрытый миксер звука. Делаем его доступным и затем устройстом записи по умолчанию.
После этого напротив миксера появится столбик, означающий, что он используется для записи.
И вроде все — можно приступать к переводу аудио в текст в модуле транскрибирования, при этом мы слышим звук из колонок и не нужно никаких повторителей.
Пользователь Виктор поделился опытом установки стерео микшера в случае если его нет в системе.
Использование виртуального кабеля
Нашел сегодня бесплатную замену программе Virtual audio cabel (VAC). Альтернатива почти свободно распространяется (там странная лицензия donationware) на сайте http://www.VB-CABLE.com.
Правда, предлагаемый там программа для повтора аудио у меня не заработала, но создать виртуальный кабель получилось и я смог распознать аудио без микрофона.
При переводе аудио с помощью программ, создающих виртуальный аудио кабель происходит неприятное явление — текст накапливается в поле предварительного просмотра и не попадает в результирующее поле. После порядка 5 минут распознавания программа отключается и высвечивается ошибка «error network». Так как ошибка находится вне кода блокнота, то просто исправить ее нельзя (правда можно обойти, например, выключением записи через некоторые промежутки времени).
От 07.11.13. Сделал принудительный перенос из предварительных результатов в результирующее поле при превышении длины текста 300 символов. Теперь проблема практически решена (17.12.2014 Теперь уже есть специальное Поле задания длины буфера фраз).
15.12.2013 Для сравнения привожу результаты транскрибирования mp3 2.5 минутного отрывка записи сказки Пушкина, скаченной с популярного сайта bibe.ru. Bite rate записи равнялся 128 kbps, колонки и микрофон самые обычные.
Результат перевода аудио с помощью колонок и микрофона
Результат перевода аудио с помощью программы VB-CABLE
Настройка виртуального кабеля
1. Скачиваете виртуальный кабель, распаковываете его в папку и запускаете либо VBCABLE_Setup.exe, либо VBCABLE_Setup_x64.exe (в зависимости от разрядности вашей Windows)
2. Открываете окно управления записывающими устройствами и делаете CABLE Output устройством по умолчанию.
3. Открываете окно управления устройствами воспроизведения и делаете CABLE Input устройством по умолчанию.
4. Теперь можно приступать к транскрибированию. После этих манипуляций звук будет идти из выхода аудио на запись, микрофон при этом перестает работать. Чтобы вернуть его для работы нужно сделанные исменения откатить (вернуть все назад).
Использование физического кабеля
2.06.2014. Пользователь Владимир Гусев предложил использовать для транскрибирования кабель 3.5 jack- 3.5 jack. Один конец кабеля при этом вставляется в выход на колонки, а другой на вход для микрофона. Качество при этом методе получается близкое к качеству, полученному на vbcable, но нет неприятного эффекта накапливания текста в буфере предварительного просмотра. Для контроля звука он также предлагает использовать кабель с размножителем.
Транскрибирование аудио в Linux
Для Linux организация виртуального кабеля делается средствами самой операционной системы. По крайней мере мне в Ubuntu ничего устанавливать не пришлось. По-моему, я не использовал терминала даже, работал только через графическую оболочку.
Стерео микшер в Mac OS
Для организации стерео микшера в Mac OS можно использовать последнюю версию soundflower.
А как все таки подробнее вы это пробовали?
Да пробовал, иначе бы не писал. Устанавливаете программу и у вас появляется в playback device CABLE Input, а в Recording device — CABLE Output. Делаете их по умолчанию (SET a default device), после чего звук идет на запись, минуя микрофон и колонки.
А при использовании этой программы какой должна быть максимальная длительность аудиозаписи, просто у меня 3 часа идет запись, если нужно поделить то по сколько минут нужно делить и как это сделать? P.S.Спасибо за сайт, очень полезный.
Я бы сначала дал 3 минуты и если качество меня бы устроило, то отключил бы через 20 минут и посмотрел снова и так далее. Если плейер аудио подымает, то делить не нужно, блокнот работает со звуком, а не с файлом.
Спасибо за ответ, только теперь возникли проблемы с этой программой, сделал все как сказано здесь http://www.youtube.com/watch?v=45Zmu1RmoKs, звук идет в line 1, но сайт пишет error no speech, все настроено правильно.
Это не мое видео. И кстати о какой программе идет речь? Если о VAC, то она платная и я ее не использую.
Уважаемый admin. Последний вопрос если позволите, есть ли ограничение количества символов при диктовке через микрофон?
Как такового лимита у поля textarea скорей всего нет, но думаю что превышения 64кбайт может иметь неприятные последствия, хотя не пробовал, во всяком случае сохранить такое поле не удастся.
Здравствуйте,
Включила тестовый режим на два дня, который, в теории, позволяет пользоваться расширенными возможностями. Пытаюсь транскрибировать файл больше 15 минут, с метками и без, и все равно блокнот не транскрибирует больше 15 мин, и выводит соответствующее сообщение.
Так как же его убрать и за один раз транскрибировать один час, например? Заранее спасибо за пояснения, не нашла информации ни о каких дополнительных манипуляциях. А время-то ограничено, как в тестовом, так и в платном варианте, и оно идет…
Скорей всего не залогинились в блокноте или вошли в другой аккаунт в блокноте. Пришлите скриншот как сказано в https://speechpad.ru/contacts.php
Планы на блокнот большие… Попробовала транскрибацию, видео с ютюба прекрасно загрузилось, но запись аудио не получилась. Ладно, попробовала записать своим голосом с микрофона, язык испанский, включила испанский, но… разочарование…
не пишет… пишет слова похожие на русские и на русском языке, а испанские нет…
Такие у меня надежды были и ничего не получилось… Может быть что — то в настройках нужно поменять? У меня версия блокнота 5.2
Галина, язык нужно установить в блокноте, там есть выпадающий список. У блокнота версий нет (это сайт), версии есть у расширения, на сайте оно роли не играет. Транскрибирование очень сильно зависит от качества записи и от дикции говорящего, как правило большинство роликов и записей этому требованию не удовлетворяют, но может повезти.
Я разобралась. В выпадающем списке я все правильно сделала, выбрала испанский. Сегодня я снова попробовала и ничего не получилось, но я же лох и поэтому попробовала все кнопочки исследовать. Нажала на кнопочку «перевод» и, (о, чудо) получила испанский с голоса. Вот ведь, воистину: «Ищите и обрящете». Не мытьем, так катаньем. С транскрибированием буду разбираться. Может быть на форуме помогут? Попробую программку установить «без микрофона». Спасибо большое!!! Я уже наговорила целую лекцию, которая была в аудио формате. Получилось быстрее, чем слушать и набивать на клавиатуре. Очень ВЫ мне помогли, думаю дальше будет еще интереснее, да и работа продуктивнее…..
Добрый вечер Галина. Кнопка перевод вообще-то нужна, только для того чтобы перевести на другой язык. Так что в следующий раз можно ее не нажимать, испанский с голоса будет все-равно идти.
И еще я поняла, что качество микрофона имеет важное значение. Мне подарили профессиональный, разница чувствуется…
Галина, видео yutube не стартовало, я это поправил сейчас (были изменения в youtube и я их не отследил)
Добрый день, Вы не могли бы все же подробнее, желательно пошагово описать использование виртуального кабеля? Поставил его, сменил устройства по умолчанию (вход и выход) в настройках звука на кабель. Вот с этого момента — неясно, что делать дальше. Запускаю файл (mp3, 64 kbps) в винампе, включаю запись в голосовом блокноте, но эффекта нет. Пытаюсь включить файл во встроенном плеере (панель транскрибации) и пустить запись — то же самое, текстовые поля остаются чистыми. звука при этом, понятно, не слышу, т.к. аудиокарточка отключена — вместо нее по умолчанию кабель. Мне кажется, я не понимаю какой-то принципиальной вещи, но какой? Спасибо!
Ok. Давайте по-порядку.
1. Проверяем работу модуля транскрибирования с использованием колонок и микрофона.
1.1. Выбираем mp3 кнопкой выбора файлов
1.2. Кладем микрофон к колонкам
1.3. Нажимаем кнопку «Включить запись», кнопка становится рыжей, автоматически включается воспроизведение и текст начинает появляться в полях.
2.Проверяем с использование VB-CABLE
2.1. Устанавливаете его как устройство по умолчанию для recording и playback (см. картинку в посте).
2.2.Выбираем mp3 файл
2.3. Аналогично 1.3.
Большое спасибо! С колонками проверить, к сожалению, пока не могу — их нет у меня. Пытался наушники на полной громкости к микрофону приложить — не воспринимает. Но с кабелем я так и делал, как у Вас описано, что-то не фурычит.. Очевидно, проблема индивидуальная. Если решу ее — отпишусь. А так, через микрофон все работает как надо, пользуюсь и благодарен за сервис)
Спасибо, разобрался.
Возникает вопрос: а что поможет улучшению качества обработки голоса? Имею ввиду убирание шумов, повышение высоких частот голоса и т.д. в специальной программе.
Не пробовал — проверите, отпишите пожалуйста.
Спасибо огромное за данный ресурс — вещь просто архинужная. Однако для начала нужно разобраться что к чему. Во-первых перешла по указанной вверху ссылке — скачать программу не удаётся (кнопочка скачать жмакается — реакции никакой). Попробовала вариант со скрытыми возможностями винды (у меня семёрка). Залезла куда положено, но вместо того, что описано 23.08.2014, у меня две возможности открываются правой кнопкой мыши: показать отключённые устройства и показать отсоединённые устройства. Обе галочки поставила, но ничего из описанного не появилось. Может есть какие соображения как преодолеть эту проблему?
Зашел сегодня на http://vb-audio.pagesperso-orange.fr/Cable/index.htm и кнопочка download прекрасно жмакается (оранжевая такая внизу). Но всегда есть два железных варианта колонка и микрофон или аудио кабель. Миксер у меня тоже работал на 2 из 3 компьютерах (видимо дело в драйверах).
Кабель установить получилось, а также сделать его устройством записи по умолчанию. Однако транскрибация не идёт. Во первых: Закачала файл и при воспроизведении я слышу звук, а этого как я понимаю, быть не должно. Во вторых у меня в голосовом блокноте нет знака микрофона (не знаю как правильнее сказать кнопка или пиктограмма), хотя при первом входе и нажимала разрешить (при этом голосовой поиск в хроме работает). Приложения и расширения тоже вроде бы все установлены. Подскажите пожалуйста, какие могут быть проблемы и что можно сделать. Заранее благодарна.
Там в комментариях было написано: Устанавливаете программу и у вас появляется в playback device CABLE Input, а в Recording device — CABLE Output. Делаете их по умолчанию (SET a default device), после чего звук идет на запись, минуя микрофон и колонки. То есть кабель не только устройством записи, но и устройством воспроизведения по умолчанию. В голосовом блокноте давно не знака микрофон (убран), все управление делается кнопкой «включить запись».
Уважаемый Admin,
Eсть ноут I5 со встроенным микрофоном и WEB-камерой под Windows 8.1. При записи файлов mp3 с плеера (VLC , WMP) в Блокнот непосредственно (без VB-CABLE и др.) все работает, пишет. Но кроме основного текста пишет посторонний текст.
Пример записи:
Lifehouse i want to play soccer двойной системе 11000000 xml file to comprise как научиться break dance таймвеб хостинг sd.tom.ru в каком месте ты у меня в ад мотоцикл в минске на дискете милицию.
В плеере в это время звучит английский текст, который я запустил. Начало Примера из этого текста. Иногда все идеально. Как такое может быть? Откуда лезет? Как избавиться?
Иван, спасибо за комментарий. Видимо, на главной странице не хватает текста: Голосовой блокнот не работает с внутренним микрофоном ноутбука и нельзя использовать внутренние колонки ноутбука для транскрибирования.
Уважаемый Admin.! А можно ли эту программу использовать для перевода аудио файлов в фильме в текстовые титры? (Я понимаю, что при этом, надо весь аудио материал разбивать на отдельные фрагменты, т.е. это и будут титры ).
В программе есть возможность генерировать титры для ютюб в формате srt, в общем этот процесс мало отличается от генерирования титров для фильма.
Добрый день!
1. Нужно ли дополнительно выставлять параметры для CABLE Input и CABLE Output, например регулировать уровни, громкость и пр., имеет ли это значение?
2. Часто из поля записи фрагмента в результирующее поле расшифровка не переносится, просто пропадает.
3. Результирующее поле имеет ограничение? Текст пишется до заполнения его…
1. Голос распознается обычно при разных уровнях, главное чтобы не совсем мало и не очень много (зашкаливало)
2. Видимо уровень достоверности был настолько мал, что просто пропустил этот фрагмент
3. Результирующее поле скорее всего ограничено просто правилами html, но я бы не рекомендовал работать с длинной больше 64 кб
подскажите ставлю видео на транскрибацию через примерно 2 минуты начинает снова с нуля играть с чем это связано?
Может видео такое. Просто в проигрывателе оно вылетает?
Огромнейшее спасибо! Без вас, ну никак! И в рамблер подтверждение ждала, и браузер не тот, и микрофон в командной строке был отключен, и кабеля не оказалось, скрытый микшер выручил! А с вами даже я «чайник» теперь видео могу в текст перевести! РЕСПЕКТ!
скрытая критика 🙂
Заметил один бзик в работе программы. При транскрибации видео с ютюба, через скрытый микшер или через вирткабель в момент перескока текста из малого окна в большое, транскрибация замирает на 2-3 секунды, а видео в это время идёт и из — за этой паузы «теряется» два-три слова текста. Хотелось бы узнать, какая такая причина может так тормозить программу .
С другого видео, где лектор разговаривает помедленнее и с паузами, перескок текста идёт нормально.
Там немного по-другому происходит. Когда длина фраз в буфере предворительном превосходит заданное значение (переключатель можно сделать видимым, а по умолчанию там 300 символов) происходит искуственный сброс из поля предварительного просмотра в результерующее. Во время этого сброса возможна потеря некотрых слов на границе. Буфер переполняется обычно при использовании виртуального кабеля и невнятной дикции. В принципе, можно было бы немного возвращать назад, но тогда дубли будут.
Так советуете что? Уменьшить число символов в малом окошке?
В данном случае я спрашиваю у вас, стоит ли пытаться промотать немного назад (секунды на две, три) или это будет только мешать?
Закачала виртуальный кабель , а как распаковать и запустить не знаю . Поскажите !
Читайте внимательно инструкцию, программа бесплатная, транскрибирование. Индивидуальной поддержки не предусматривается.
Что делать если звук есть,текст не прописывает?
Пришлите скриншот и напишите какой браузер и какой виртуальный кабель вы используете.
… Скачал vbcable по вашей ссылке,скачалось архивом — при попытке установки пишет — «vbcable installation error»… Что дальше сделать?!..
vbcable не моя программа, поддержкой ее не занимаюсь. Если не получается- ставьте микрофон у колонок
Благодарю. Очень полезная статья. Нашла микшер В windows 10, работает!
Здравствуйте! При транскрибации с youtube error: language-not-supported
видео на английском вкладка тоже на английский выбрана
Скорее всего вы пользуетесь Яндекс браузером, а нужен Хром.
Спасибо за подробную инструкцию. Вопрос вот такой: возможна ли транскрибация не-MP3 файлов? Другими словами есть некие видео в специальном формате и есть проигрыватель для этого формата. Конвертировать в MP3 пока не получается. Можно ли с помощью виртуальных или не виртуальных кабелей использовать SpeechPad для такого видео?
В принципе блокноту все-равно откуда звук идет, единственно он при ошибках не сможет останавливать чужой проигрыватель.
А что тогда выбирать в настройках «Медиа тип»: YouTube video, HTML5 video, HTML5 audio?
Снимите флажок — Запускать синхронно с записью и ничего не выбирайте. А можно вообще просто в блокноте, не открывая модуль транскрибирования.
Установил vbcable но не могу найти на компьютере панель управления им. В файла скачанных с сайта разработчика есть файл VC CABLE CONTROLPANEL запуская его открывается окно совсем не такое как в видео уроке. Подскажите возможную проблему.
Я не использовал и не открывал эту панель. Просто установил (нажал на setup) драйверы. В звуковых настройках после этого появляются кабели как устройства.
В настройка realtek Вы имеете ввиду?
https://www.youtube.com/watch?v=tt4tloecmbY
Здравствуйте, тут еще можно задавать вопросы. Не получилось у меня преобразовать английскую речь из мр3 в текст тоже английский .Срочно нужно
Посмотрите видео об ошибках транскрибирования. Обратитесь в поддержку.
Здравствуйте, возникла проблема с микшером, но «выручил» виртуальный кабель, но всеравно полученный текст скорее набор слов (даже не из лекции) хотя при прослушивании то что говорит лектор вполне возможно услышать. Подскажите пожалуйста что можно сделать чтобы поправить положение.
И ещё, подскажите пожалуйста какие характеристики лучше всего выставлять на диктофоне для последующей транскрибации текста (возможно в этом и есть проблема).
Здравствуйте. Вы может либо воспользоваться временными метками и вручную делать транскрибацию, либо еще раз сделать ее методом проговаривания. Про диктофон ваш ничего сказать не могу пробуйте сами. При транскрибировании думаю, что защиту от шумов надо в этом случае ставить (время перезагрузки) и следить за уровнем звука.
А если нет колонок вообще, можно транскрибировать запись Ютуб в текст?
Да, об этом и речь, вот если нет видеокарты, то вряд ли.
Добрый день. Может быть кто-то подскажет, почему на планшета при голосовом вводе одно слово дублируется, т.е. печатается 4-5 раз?
На андроиде пока не работает (там на планшете у вас андроид наверное)
Здравствуйте! Скажите, через хром на Маке должно работать? к сожалению, текст не появляется. Спасибо!
Работать что? На маке все работает кроме интеграции.
Бобр бобр!
1. Спасибо за программу; она понимает мой английский, немецкий, русский вот даже; запятые с восклицательными и даже точку с запятой! Я прямо аж — як казали стародавні японці — ja okchuevlyon!
2. При попытке транскрибировать из ютубовского видео выдаёт error: no-speech.
Зарегистрировался, нажал «тестовый период», снова пробую — error: no-speech.
Воткнул аудио-выход с видеокарты в разъём микрофона; система видит входящий звук, но — error: no-speech.
Xubutnu 16.04.3, PulsAudio.
Тестовый период ни при чем, он влияет только на интеграцию и максимальное время транскрибирования. Об организации микшера в Linux — https://vk.com/speechpad?w=wall-37701517_690 (автор там пишет о консольной команде, но можно и без нее) Попробуйте сначала просто микрофон положить у колонок — должно и так плохо, но работать.
а что работает из виртуального с виндовс10? не загружается файл?
Я только что загрузил его, там написано что win10 поддерживается. А вообще лучше стерео микшером, если он в системе есть пользоваться.
виртуальный кабель настроил. но кнопка интеграция с ОС так и не нажимается. но текст пишется в маленьком окне а в большое не переносит почему то
Интеграция совсем не нужна для транскрибирования. А виртуальный кабель не нужен для интеграции.
все норм. предыдущие комменты можно удалить. если вы не против)))
самое главное для виртуального это было разархивировать на диск (именно на диск!!!) и установить от имени администратора.
флажок на синхронизации так и не нажимается, но все записывает. достаточно годног все работате. и как я понял надо покупать верстю за 300 рублей, чтобы видео транскрибировать или хватит версии за 100?)
благодарю за терпение и понимание!!
Чтобы флажок интеграции нажимался нужно установить расширение и модуль интеграции. Но он (флажок) вам не нужен для транскрибирования. Версия по 300 это пакетный режим и если вы не намерены сразу много файлов транскрибировать, то оно вам и не нужно.
Добрый день!
Интересует такой вопрос : Транскрибация с помощью данной программы не происходит с хинди-языка?
И если -нет, то подскажите пожалуйста программу , которая поможет мне в этом? Интересует именно хинди язык.
Язык hindi поддерживается, его код hi-IN. Как добавить язык в голосовой блокнот читайте в https://cloud.google.com/speech-to-text/docs/languages
Микшер появился есть. Всё заработало.
Настроил виртуальный кабель, работает. Но я не слышу звука. А он нужен (на лету буду текст смотреть). Какие есть выходы из этого?
Поставить linux (там работает) или найди комп где будет mixer в windows.
Сделала транскрибацию аудио, в текст, если не исправлять по ходу текст на выходе, прочесть потом невозможно. Набор слов, окончания слов коверкает, жуть жуткая, бред полный…..
Для некоторых бред, для некоторых нет. Все зависит от исходного аудио.
Добрый день,
А в windows 10 возможно настроить виртуальный кабель?
А вы уверены, что у вас нет микшера?
Здравствуйте! Поскольку микшера нет, пришлось скачать и подключить виртуальный кабель. Но он кажется не подключился. В свойствах пишется. что «Нет данных о гнезде подключения»ю И микрофон, судя по индикации работает, хотя я с него снял галку.
Шлите скрины на почту
https://speechpad.ru/blog/audio-transcribing/support