Перевод аудио в текст в модуле транскрибирования основывается на подаче звука с колонок на микрофон. Это можно достичь либо, положив микрофон к колонкам, либо посредством аудио кабеля, как физического, так и виртуального. Можно также использовать стерео микшер.
Транскрибирование звуковых файлов длинной более 15 минут относится к расширенным возможностям блокнота. За них взимается небольшая плата. Чтобы попробовать или оплатить ее, нужно зарегистрироваться на сайте и зайти в кабинет пользователя голосового блокнота (появится оранжевая ссылка).
Панель перевода аудио в текст открывается после нажатия на кнопку +Транскрибацию на главной странице сайта.
На приведенной картинке я обвел красным то что относится к этому модулю и перечеркнул, то что использовать вместе с ним не надо. То есть не нужно включать флажки вывод в буфер и интеграции. Поле Длина буфера фраз не дает накапливаться тексту в поле предварительного просмотра (актуально при использовании виртуальных или физических кабелей).
Переключатель Защита от шумов используется для борьбы с зависанием ввода в шумных видео. Хорошей альтернативой этому переключателю является установка переключателя Пауза в речи, например, в одну секунду. Переключатель Пауза в речи можно сделать видимым в настройках интерфейса кабинета пользователя.
Для загрузки видео с Youtube в модуль нужно ввести его ID.
Транскрибирование может вестись в двух режимах, зависящих от установки флажка Запускать синхронно с записью. Когда этот флажок включен, то нажатие на кнопку включить запись одновременно включает проигрыватель, а остановить запись — останавливает его.
Весь алгоритм работы в этом случае заключается:
1) в загрузке ролика или файла в проигрыватель
2) обеспечению поступления звука с ролика на микрофон
3) Выставлению настроек, отметке флажка вставлять метки времени
3) нажатию на кнопку запуска.
Если флажок Запускать синхронно с записью не установлен то появляется панель задания времен паузы и работы.
При таком режиме кнопка включить воспроизведение запустит проигрыватель в прерывистом режиме, то есть после 5 секунд (как задано на нашем рисунке) воспроизведения он будет останавливаться на 5 секунд паузы. Кнопка же включить запись от нее не зависит. Если время паузы и время воспроизведения не установлены, то работает просто кнопка включить/отключить воспроизведение.
Такой режим может быть использован для полуавтоматического транскрибирования. При этом режиме роль виртуального аудио кабеля играет человек — он прослушивает запись в течении времени воспроизведения и надиктовывает ее в течение времени паузы.
Обработка текста после транскрибирования
Текст получаемый методом распознавания речи содержит ошибки. Для его исправления используются метки времени, полученные при транскрибировании. В этом режиме нужно также отключить флажок запускать синхронно с записью или воспользоваться горячей клавишей запуска/останова проигрывателя для расширения блокнота.
Алгоритм исправления следующий:
1) текст с метками сначала приводится к более удобному виду последовательным нажатием кнопок метки в SRТ и SRT в метки
2) выставляется флажок запуск с меток времени
2) курсор устанавливается на нужное место текста
3) с помощью горячей клавиши или с помощью кнопки включить/выключить проигрыватель прослушивается данный кусок записи (срабатывает ближайшая слева от курсора метка времени)
4) вручную или при использовании кнопок блокнота редактируется текст
5) метки убираются нажатием на кнопку убрать метки времени, или текст приводится к формату SRT (если делаются титры для Youtube)
Пакетный режим транскрибирования аудио и видео файлов
Транскрибирование аудио и видео файлов в пакетном режиме (для более чем двух файлов) относится к премиум-функциям голосового блокнота. Как и расширенные функции они доступны после оплаты в кабинете пользователя. Чтобы попробовать этот режим нужно при загрузке аудио и видео выбрать сразу несколько аудио или видео файлов, удерживая при выборе мышью клавишу Ctrl.
Обращение в техническую поддержку
При обращении в техническую поддержку. Нужно прислать четыре скриншота:
1. Экран окна блокнота (можно сделать два скриншота, если не помещается)
2. Скриншоты вкладок записи и воспроизведения звука
3. Скриншот настройки микрофона в Chrome (chrome://settings/content/microphone)
не пойму как вывести готовый текст в ворд или отослать по почте
Откуда вывести, если из блокнота, то самое простое нажать на кнопку «Копировать»
В режиме транскрибации не закачиваются файлы.Что делать?
Скорее всего просто это не формат файлов HTML5
Здравствуйте. Подскажите какие настройки выбрать, какой тариф и так далее, чтобы я могла транскрибировать видео файлы длительностью 1-1,5 часа и возможно ли это делать в голосовом блокноте ? или резать видео на фрагменты? Благодарю!
Вам нужны расширенные возможности блокнота, приобрести их можно в личном кабинете, который доступен после регистрации.
Здравствуйте, а почему примеры только с видео файлами. Мне необходимо распознать аудио mp3 файл. Конвертер просто не существует в html5. Вы писали, что есть такой конвертер онлайн. Но мне в день нужно 1000 новых mp3 файлов преобразовывать с диктофона. Явно онлайн не годится.
Получается аудио и видео преобразование только с ютюба.
Speechpad загружает mp3, выберите HTML5 audio и загружайте.
В транскрибации при нажатии кнопки»Включить запись» ничего не происходит , только напротив Уровня распознавания появляется надпись «error: language-not-supported» . Как это исправить?
Вы используете Яндекс браузера вместо google Chrome
Добрый день!
Как обойти\решить eror: no speach? В наушниках звук есть, два слова программа распознала, а дальше выдает ошибку.
Судя по теме комментария, это относится к транскрибированию. Тогда звук должен попасть в микрофон. Либо его к колонкам надо поставить, либо использовать виртуальный кабель.
мне нужно распознавать дебаты в суде.
Хром не устанет онлайн 4 часа подряд транскрибировать?
Мне кажется будет лучше через каждые 20 минут скидывать результат из результирующего поля. Так будет надежней.
Доброго вам времени суток, автор программы и все остальные) Скажите пожалуйста, автор, а почему при транскрибации мне приходится буквально каждые полминуты останавливать запись (при том что текст идёт и идёт) и в предварительном поле он пишет всего два-три, от силы десять слов? Я бы не останавливала, но сразу стала замечать что он напишет несколько слов (которые расшифрует, дальше текст идёт, но его соответственно при выключенном микрофоне и динамиках не слышно, а сама программа никак не откликается? Пять минут после молчания, я думаю смысла нет больше ждать чтобы она «заговорила», то есть начала дальше расшифровывать. Поэтому приходится останавливать через каждые минуту пол-минуты. Неудобно, честно.
Внимательнейше прочла статью, а потом установила Virtual audio cabel (VAC), выключила микрофон и сделала по умолчанию его в первой вкладке, то есть всё как вы на видео объясняли, но.. вот такая вот петрушка.
Кстати у меня при нажатии кнопочки транскрибация нет строки «Длина буфера фраз». Вот нет и всё. Подскажите, может это именно из-за этого? Браузер Гугл Хром.
Доброго вам времени суток, автор программы и все остальные)
Скажите пожалуйста, автор, а почему при транскрибации мне приходится
буквально каждые полминуты останавливать запись (при том что текст идёт и идёт, а в предварительном поле он пишет всего два-три, от силы десять слов?
Я бы не останавливала, но сразу стала замечать что он напишет несколько слов (которые расшифрует, дальше текст идёт, но его соответственно при выключенном микрофоне и динамиках не слышно, а сама программа никак не откликается? Пять минут после молчания, я думаю смысла нет больше ждать, чтобы она «заговорила», то есть начала дальше расшифровывать. Поэтому приходится останавливать через каждые минуту пол-минуты. Неудобно, честно.
Внимательнейше прочла статью, а потом, выключила микрофон и сделала по умолчанию его в первой вкладке, то есть всё как вы на видео объясняли, но.. вот такая вот петрушка.
Кстати у меня при нажатии кнопочки «транскрибация» нет строки «длина буфера фраз». Вот нет и всё. Подскажите, может это именно из-за этого? браузер Гугл Хром, ноутбук dns (если надо — подробно модель напишу и что ещё надо), колонок нет, микрофон встроенный.
Думаю, что это из-за длины буфера. Включить этот переключатель можно в настройках интерфейса, и выставите там 100 символов в длине буфера.
А, всё, нашла, спасибо) Надо было снять галочку с «запускать синхронно с записью» и тогда эта «длина буфера фраз» появится. Но всё равно, как-то обрывочно что ли идёт. То ли из-за того что в мультсериале много фоновой музыки и программа не всегда распознаёт саму речь из-за неё, то ли из-за того что я не могу по толковому выставить «время воспроизведения в секундах и время паузы в секундах. первое ставлю на максимальное — хочется чтобы без перерывов было, а второе на минимальное, но.. опять же одну фразу он расшифровывает (пусть и с ошибками и чаще вообще с другими похожими по звучанию словами), а вторую — упорно молчит. и молчит и молчит.. пока я не нажму на кнопку «отключить запись». Дальше расшифровка не идёт почему-то. Иногда он расшифровывает две фразы за раз, но это редкость. Особо эта галочка ничего не дала, разве что диапазон фразы стал длиннее, раньше оно вообще полфразы или пару слов расшифровывало.
Ладно, хоть что-то, спасибо большое)
Поле появилось, потому что я после вашего комментария сделал его доступным в транскрибировании. (https://speechpad.ru/blog/recent-changes/) Так что галочка ни при чем, поставьте ее на место.
Дорогой автор, спасибо вам за ваши ответы! Я пробовала с разными записями, в тот числе которые вы пытались транкрибировать и пришла к выводу что именно такие чёткие и спокойные видео с минимум шумов лучше всего и расшифровываются, у меня практически получилось тоже что и у вас на тех двух видео) Но увы, в сериях мультфильмах о Чёрном Плаще порой слишком много звуков, фоновой музыки и быстрая речь, (подчас и мне приходится иной раз перематывать отрывок в пять-десять секунд много раз чтобы понять что же там говорят. Так что ваша программа немного с такими записями не справляется. Но всё равно — спасибо за ваши ответы и ваше внимание. И удачи вам)
Я всё же буду иметь вашу программу в виду и буду всем её советовать, это такой большой труд) Ещё раз — большое вам спасибо))
Удачи!
я никак не пойму как расширить, чтобы получить возможность транскрибация более 15 минут
Зарегистрируетесь и войдите в личный кабинет, там все видно будет.
Здравствуйте! Сегодня зарегистрировалась в блокноте, подключила Гугл Хром, включила тестовый режим, подключила расширение, а интеграции — нет.Что делать?
Выполнить по пунктам https://speechpad.ru/blog/windows-integration/ (в вашем списке не хватает установки модуля интеграции)
Здравствуйте! Пытаюсь загрузить файл для транскрибирования (mp3). Настраиваю все в соответствие с Вашим видео. Когда я нажимаю «включить запись», ничего не происходит (запись не запускается, кнопка не становится оранжевой). Пробовала и с виртуальным кабелем и с микшером. Скажите, пожалуйста, в чем может быть проблема.
Добрый вечер. Скриншот как сказано в https://speechpad.ru/contacts.php пришлите. А так, скорей всего браузер не хром.
Добрый день. В описании программы написано при аудио свыше 15 минут взимается символическая плата, хотелось бы узнать размер данной платы. А также подскажите может ли программа переводить речь в текст из видеофайла?
Анна, плата указана на странице speechpad.ru/users.php, максимум 100 руб в месяц сейчас. Прочтите статью в блоге о возможностях https://speechpad.ru/blog/audio-transcribing/
Добрый день! Оплатила расширенные возможности программы, но окно о «доп.возможностях» программы продолжает выскакивать и блокирует работу. Что делать?
нужно работать в авторизованном режиме, то есть войти под своим логином
Не могу найти информацию о транскрибации видео расположенного на компьютере. С аудио все получилось с ютубом тоже.
Точно так как аудио, только выбрать надо видео, вот как здесь показано https://www.youtube.com/watch?v=ymbWxiL7YGY —
Вот скриншот https://yadi.sk/i/NPj1Kdx93Gh9ej
Видео должно быть в формате html5, avi не годится.
здравствуйте, я недавно начала пользоваться вашим сервисом, еще не разобралась, что к чему.
один раз пользовалась на сайте для голосового набора текста. сейчас я зашла под своим логином, нажимаю кнопку «включить запись» — кнопка не работает. в панели управления написано: «Уровень распознавания error: blocked».
подскажите пожалуйста, что мне делать?
Видимо случайно заблокировали микрофон, прочтите здесь https://speechpad.ru/blog/web-speech-api-usin/#comment-3456
Здравствуйте! «Разработан пакетный режим транскрибирования файлов» — а для ютуб-видео не планируете добавить возможность пакетного распознавания? Спасибо!
Просто я не очень представляю кому он нужен
Проще вбить руками, чем с этой ерундой возиться. Ошибки замучишься исправлять!
Разные режимы, разные задачи и разное качество. То есть надо подходить контекстно.
Здравствуйте! Во время транскрибирования, где-то через минуты 2-3 зависает все, не могу переключиться.. В чем может быть причина?
Используйте настройку защита от шумов, установите ее в 7 секунд
Здравствуйте! Вылезает вот это:
Чтобы транскрибировать файлы длительностью больше 15 минут нужно включить расширенные возможности голосового блокнота см. https://speechpad.ru/blog/about-speechpad/
Подскажите, пожалуйста, что делать? Спасибо!
Эти функции включаются в личном кабинете. Нужно залогиниться и тогда появится оранжевая ссылка личного кабинета.
Я зарегистрировалась сразу и оплатила за использование премиум-функций сервиса на один месяц (04 .10.) В начале работал не плохо, но сегодня выдает эту картинку..
Там два вида: расширенные (это 100 в месяц) и премиум функции (300 р). Премиум это когда много файлов за один раз, а расширенные это речевой ввод и транскрибирование больше 15 минут.
И что, я должна и заплатить и за расширенные тоже? Я думала, что в премиум — функции входит все… До сих пор работал же без сбоев..
Это независимые платы. По возврату или смене пишите тарифа на почту info@speechpad.ru. Блог вообщем не для этого.
Почему не распознает файл? Выдает error: blocked
Скорей всего неправильная настройка на вкладке записывающие устройства. Проверьте также какой микрофон установлен в хроме.https://speechpad.ru/blog/speechpad-errors/#comment-15006
Добрый день.
Подскажите что означают смежные метки SRT в траскрибированном файле.
Вот фрагмент примера.
[00:00:01,000] hey guys and welcome back in So before we jump into did extraction there is one more thing that we should talk about so before we go out or a little introduction to what data extraction is there how we’re going to use it [00:00:14,200] [00:00:13,800] use it to parse website now sometimes if there are very big services so for example if pulled up the Twitter page here and we’ll talk about with us in the second there are special services devised for [00:00:28,100] [00:00:27,900] [00:00:28,500] for developer [00:00:28,700] …
Я выделил непонятные мне метки. Первая из выделенных наверное метка времени и через запятую в скобках это длительность фрагмента?
Сразу идет следующая метка где время меньше предыдущей метки. Непонятно что означают три подряд выделенные метки .
Есть ли возможность делать перевод строки после завершающего фрагмента чтобы новая метка начиналась с начала новой строки?
По какому принципу идет разбиение на метки? По паузам?
Здравствуйте.
Метка ставится в тот момент, когда начинается новый отрезок речи и когда заканчивается текущий.
Внутри метки в квадратных скобках стоит время любого из этих событий.
При останове записи и плеера, например, в случае останова по времени защита от шума и следующем включении плеер возвращается назад на секунду и может случится так что следующая метка меньше предыдущей.
00:00:14,200] [00:00:13,800]
Чтобы это исправить в конечном SRT есть флажок коррекция времени.
[00:00:28,100] [00:00:27,900] [00:00:28,500]
Метка средняя началась но не был получен результат. При переводе в SRT средняя будет игнорирована
>>Есть ли возможность делать перевод строки после завершающего фрагмента чтобы новая метка начиналась с начала новой строки?
Сделайте перевод в SRT и обратно они упорядятся
Перевод вашего фрагмента с коррекцией
1
00:00:01,000 —> 00:00:14,200
hey guys and welcome back in So before we jump into did extraction there is one more thing that we should talk about so before we go out or a little introduction to what data extraction is there how we’re going to use it
2
00:00:14,300 —> 00:00:28,100
use it to parse website now sometimes if there are very big services so for example if pulled up the Twitter page here and we’ll talk about with us in the second there are special services devised for
3
00:00:28,500 —> 00:00:28,700
for developer
Обратный перевод
[00:00:01,000] hey guys and welcome back in So before we jump into did extraction there is one more thing that we should talk about so before we go out or a little introduction to what data extraction is there how we’re going to use it
[00:00:14,200][00:00:14,300] use it to parse website now sometimes if there are very big services so for example if pulled up the Twitter page here and we’ll talk about with us in the second there are special services devised for
[00:00:28,100][00:00:28,500] for developer
[00:00:28,700]
Хочу перевести вебинар продолжительностью 2 часа, но переводит только первые 30 сек. это связано с тем, что я пользую тестовый период? если надо покупать подписку, то какой достаточно для моих целей?
Нет это не связано с тестовым периодом. Скорей всего надо поставить защиту от шумов 7 секунд
Здравствуйте! Подскажите пожалуйста, какой аналог virtual audio cable можно поставить на mac os high sierra ?
Я дал ссылки https://speechpad.ru/blog/vac-alternative/#macos Это проверено мною на mac os high sierra 10.13.4
Доброго времени суток. Почему набирается только 2-4 слова при транскрибировании аудио mp3, а потом ничего не происходит длительное время, опять несколько слов набирает, и то в основном полнейшую ерунду выдает. Как это работает? что еще нужно, чтобы программа работала нормально? делала и как в инструкции, и меняла, работаю через хром, зарегистрирована.
Пришлите скриншот окна блокнота и скажите, что вы используете — виртуальный кабель или стерео микшер
использую стерео микшер
Значит такое качество звука. Если блокнот с голоса у вас нормально работает.
Добрый день. Забыла — как можно оплатить дополнительные возможности на speechpad. у вас в инструкции написано — зайти в кабинет? но не могу его найти. помогите, пожалуйста,
Я зарегистрирована. посмотрела в старых письмах как вы советуете — что будет прислана ссылка на кабинет — но в письме только логин и пароль
Когда вы войдете по логину и паролю, справа (в боковой колонке) появится оранжевая ссылка «Кабинет пользователя»
Добрый день. Мне нужно перевести голос на видео (на английском языке) в русские субтитры с показом в этом видео. Сам не смог разобраться. Помогите!))) И подскажите, что мне нужно для этого оплатить. Видео возможно более 15 минут. Заранее спасибо!
Сначала нужно получить английский текст с помощью транскрибирования с метками времени, потом эти метки перевести на русский. Можно, конечно, еще включить панель перевода при этом и включить там синхронный перевод, в этом случае в панели транскрибирования будет текст с метками на английском, а панели перевода текст на русском.
Здравствуйте! Не могу разобраться почему при транскрибировании вставляются только нулевые метки времени [00:00:00,000] [00:00:00,000]. Звук направляю через виртуальный кабель. Почему-то время не обновляется.
Скорей всего вместо того, чтобы нажимать на кнопку включить запись, нажимаете на самом видео или аудио. Пришлите скриншот на почту, тогда можно будет точно сказать.
День добрый, оплатил Премиум на один месяц и в личном кабинете этого не видно? в чем же дело?
у вас стоит в графах расширенные возможности и премиум функции 04.11.2019. То есть оплачено до 04.11.2019
Всем привет! Не знаю, кто-нибудь будет читать это или нет, но напишу. Можно ли из аудио файла (например, из какого-то аниме) извлечь японский текст? Простите за мой русский 🙂
Я только написал суть проблему, поэтому вопрос такой коротенький 🙂
Можно из mp3, mp4 и Youtube с помощью панели транскрибирования speechpad.ru. Из произвольного аудио потока с помощью speechpad.ru/transcriber.php
Здравствуйте1 Никак не могу разобраться с этой ошибкой, и как ее исправить. Нигде ничего внятного по поводу исправления этой ошибки найти не смогла.
http://joxi.ru/krDYE7ViJR9vZm
Если перехожу во вкладку транскрибация, ошибка та же.
Спасибо
Скорей всего у вас windows 10 и включена активация голосом, см. https://speechpad.ru/blog/speechpad-errors/#erraudio
Здравствуйте! У меня windows 7.
Закройте все окна и расширения в хроме кроме speechpad. Проверьте на нем одном. Если не получится переустановите хром.
Здравствуйте, подскажите, можно ли с помощью вашего софта переводить онлайн речь на английском (в скайпе) в текст на русском?. Важно именно в режиме онлайн. Если да, то как? Пока что-то не могу разобраться.
Яндекс в августе отключил бесплатный перевод. Поэтому функционал перевода на другие языки в голосовом блокноте закрыт. Переводчик в блокноте основывался на бесплатном переводе Яндекса.
Здравствуйте. Хотела видео с ютуба перевести в текст, пишут «Уровень распознавания error: no-speech» Как можно исправить? Видео воспроизводится
Вам надо подать звук на вход. Для этого используется микшер windows или, если его в системе нет, то виртуальный кабель. Читайте здесь -https://speechpad.ru/blog/vac-alternative/
Почему не работает регулировка воспроизведения скорости видеофайла?
При обращении в поддержку нужен скриншот. Скорей всего что-то не то делаете
Здравствуйте возможен ли синхронный перевод с русского на французский с голоса в текст,посоветуйте , пожалуйста,программу для мобильного спасибо
Google translate app
Нужен перевод с русского голоса на французский текст для мобильного спасибо
Яндекс отключил api бесплатного перевода и поэтому эта опция в блокноте сейчас недоступна. В принципе можно дать возможность каждому оплачивать перевод в Гугле самостоятельно. Но у Гугла 1млн символов стоит 20 баксов. Если вас это устроит я могу открыть такую возможность (но это для десктопа). Для мобильного какие-то были. Google translate для мобильного
ЕЩе вопрос: загружаемые видео файлы после транскрибации куда уходят?
Звук при транскрибировании уходит на серверы Гугла, откуда возвращается в виде текста. Больше никуда, во время работы с программой сервер блокнота не участвует в ней. И текст хранится тольк у вас, если конечно вы сами его не сохраните на сервере блокнота. Если используется Яндекс браузер, то вместо серверов Гугла выступают серверы Яндекса.
Добрый вечер! не могу транскрибировать аудиофайл m4a, это файл с диктофона. Расширенный возможности включены.
Конкретно в чем проблема и пришлите скриншоты как сказано в https://speechpad.ru/blog/audio-transcribing/#support
Я, конечно, сделал скрины.. Куда их переслать?
Забыл описать проблему конкретнее — при нажатии на кнопку «Включить запись» экран моргает и .. ничего не происходит. К сожалению.
https://speechpad.ru/contacts.php
отправил
ничего не получил
отправил на почту info@speechpad.ru
Письмо попало в спам не заметил. У вас на одном скрине (2) ошибка error blocked. Читайте о ней здесь https://speechpad.ru/blog/web-speech-api-usin/#comment-3456
Скрины правда неполные нет вкладки воспроизведения у звука в том числе.
Подскажите пожалуйста, куда задать вопрос по оплате
info@speechpad.ru
Здравствуйте.
К пакету транскрибации оплатила Пакетный режим транскрибирования аудио и видео файлов
Думала, что параллельно можно будет несколько файлов загружать на транскрибацию )
Загрузила 2 видео файла, как указано в инструкции.
Выбрала 2 файла. Запустила транскрибацию.
Но идет транскрибация только одного файла.
Второй как я понимаю, начнет транскрибироваться, как закончится первый.
Я что-то не так делаю?
Или смысл этой функции только в том, что создается очередь из файлов?
но они все равно трансрибируются по очереди.
Особого смысла для себя в таком случае не вижу.
Загрузить один файл после другого я в ручную могу
Пакетный режим это когда много мелких файлов, например 60. Если вам не нужен пакетный режим напишите на info@speechpad.ru я переключу его на 3 месяца расширенного
Здравствуйте. А можно с помощью вашей разработки транскрибировать слова песни в текст. Я попыталась раньше пользоваться другой программой для транскрибации, даже аудио кабель jack-jack (папа-папа) купила, но у меня ничего не вышло. И еще, в комментариях написано, что аудио файлы должны быть в формате HTML5, где -то в комментах у одного, видела, что у него формат wmv и кажется, у него все получилось. Конвертировать при необходимости нужно на сторонних сайтах или в самой Списчпед?
в формат hmlt5 входит несколько форматов, в том числе mp3, wav и еще несколько. Конвертировать можно на сторонних сайтах (можно просто audacity у себя установить по-моему у него есть конверторы). Все зависит от песни и как человек поет.
Здравствуйте!
Такой вопрос: Во время транскрибации текста идет достаточно неплохая расшифровка, но в конце фразы не разбирается какое- нибудь слово, подставляется непонятно что, и меняется вся фраза под новый смысл этого слова. Получается такая белиберда, что приходится все заново прослушивать и править вручную. Есть возможность отключить эту функцию автозамены слов?
Пусть будет просто больше пропусков, но по смыслу легче работать.
Можно поставить защиту от шумов в 7 или 5 секунд. Можно также поиграться с длиной промежуточного буфера. Посмотрите что вам лучше подходит.
Спасибо!
Эти варианты пробовал, ошутимой разницы не почувствовал. Еще пробовал со скоростью воспроизведения на 1, 0,75 и 0,5. На 0,5 вообще кошмар, не советую.
Здравствуйте, выдает ошибку error speech-editor. Оплатила функции на месяц
Такой ошибки нет (видимо speech-error) Скорей всего не подали звук на вход программы. Пришлите на почту скриншоты как сказано в https://speechpad.ru/blog/audio-transcribing/#support
Здравствуйте.
Перед транскрибацией приходится производить конвертацию и некоторые улучшения аудиофайла, поскольку изначальная запись лекций сделана на моно диктофон мобильного телефона.
После этого в целом все работает, но все же не так, как хотелось бы.
Где-то здесь (или в сети) видел, что наилучшее качество получается при параметрах звука 16 бит и 16000 кгц, но сейчас не могу найти этих данных.
Подскажите, пожалуйста, может быть опытным путем было установлено, что ещё какие-то параметры аудиофайла (записи) благотворно влияют на конечный результат?
Например, убираю шумы и поднимаю верха. Я то слышу лучше, но, может, как раз какие-то частоты программа лучше улавливает?
Использую виртуальный микрофон.
Надеюсь на Ваш ответ.
Спасибо за программу!
Чем меньше сжатие с потерей качества, тем лучше. Лучше всего, если это возможно вообще использовать форматы файлов без сжатия с потерей качества или ставить его минимальным.
Здравствуйте. Нужно транскрибировать MP3 файл продолжительностью 23 минуты. Файл сохранен на компьютере, при загрузке сервис требует доступ к микрофону и ничего не происходит. Нужно установить виртуальный кабель?
Доступ дайте. Если в windows есть стерео микшер, то кабель не нужен. Читайте здесь https://speechpad.ru/blog/vac-alternative/
Здравствуйте. Второй день не проходит оплата за расширенные возможности. С картой все нормально, оплачивал другие приложения, к вам не отправляется. Может есть другие варианты?
Добрый день. Пришлите скрин на info@speechpad.ru с ошибкой которую выдает система