Какой API выбрать для распознавания речи в фильмах?

В общем, пока знания моего английского оставляют желать лучшего пришла в голову идея на лету переводить видеоролики с помощью api распознавания речи и api переводчика. Нужен самый умный сервис, который сможет распознавать речь с примесью посторонних звуков (музыки, шума толпы, улицы и т.д.)
Доросли ли технологии до такого или я чет замахнулся?)
  • Вопрос задан
  • 416 просмотров
Пригласить эксперта
Ответы на вопрос 4
Sanasol
@Sanasol
нельзя просто так взять и загуглить ошибку
Автоматические субтитры на ютубе явно показывают что даже обычную речь(без шумов особых от говорящих блогеров) английскую достаточно сильно надо корректировать после распознавания.

А апи например яндекса годится в основном для односложных запросов например при навигации по телефонному голосовому меню, для чего собственно и используют такие апи. Т.е. распознавание на уровне да, нет, цифры.
Ну или заточенные системы под что-то конкретно типа адресов, где можно провести неточный поиск.

Субтитры для слабаков чтоль?
Ответ написан
miraage
@miraage
Lead Software Engineer
Еще как замахнулись. Если хотите переводить "разговорный" английский, вряд ли такое вообще возможно.
Дело в том, как они говорят. Очень много сокращений (reductions), прилично слэнга и идиом, которые тоже комкаются и распознать их можно только на слух. Разве что Вам нужен преобразователь в звуки, и на основе неких паттернов сюда примешаете какой-нибудь ML.
Ответ написан
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Вопрос:
Доросли ли технологии до такого или я чет замахнулся?)

Ответ:
Доросли технологии до такого
И
я чет замахнулся

Сделать это уже реально.
Осталось найти готовое API и/или создать собственную НС и обучить.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через TM ID
Похожие вопросы