@niriter
User

Голосовой вызов бота?

Хотел бы узнать, есть ли какие-то материалы по настройке вызова своего бота голосовой командой в приложении? (речь именно о методах, и общих представлениях о реализации)
Из найденных материалов только встретил habr со статьей яндекса об алисе

В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.


Для гугла не смог конкретно сформулировать запрос - возможно только я чукча и не смог)
  • Вопрос задан
  • 41 просмотр
Пригласить эксперта
Ответы на вопрос 1
@tobbey
Вам надо wake word detection - активирование бота при помощи слова/фразы ("Ok Google!"). Что-то типа такого.
Для голосовых команд (Speech-to-Intent engine) можно посмотреть это
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы