OlegWock
@OlegWock
Python, Java+Android, Frontend

Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Имеется железка в виде Raspberry Pi 3. Стоит распбиан и есть задача постоянно слушать микрофон и когда произносят какую-то фразу, реагировать (запускать скрипт, например). Как это лучше организовать? Если нет подключения к интернету?

Окей, я уточню. Интернет есть, но проблема в том, что скармливать ему 24-х часовую запись я не могу (скорость так себе, ограничение по трафику). Поэтому я хочу научить его узнавать мой голос с одной единой командой (обращением, что-то типа Окей гугл), которая уже будет запускать питон-скрипт (мой), который будет записывать остальной текст и распознавать через сервисы гугля или яндекса
  • Вопрос задан
  • 1939 просмотров
Решения вопроса 3
jamakasi666
@jamakasi666 Куратор тега Linux
Просто IT'шник.
Без интернета только если у вас есть бюджет в пару миллионов зеленых на серверную ферму и оплату работы стада программистов для написания распозновалки голоса.
Если в условиях задачи есть оговорка реагировать только на конкретно заданные слова которые заранее заданы для заранее известного голоса и интонации то решения есть. К примеру CMU Sphinx(сфинкс) но работает оно откровенно говоря несколько странно с Русским и вообще начинает очень плохо работать когда число команд переходит пару десятков (по крайней мере так было когда я его смотрел довольно давно). Порта на армы вроде не было но скорее всего добрые люди есть.
Есть еще самый простой вариант, заюзать яндекс\гугл\... сервисы. Из плюсов удобное апи, огроменная точность(на фоне любых оффлайн решений). Из минусов нужен инет и забесплатно ограничения на число запросов.
Еще можно задействовать андроид под это дело(точно не помню но вроде бы сервисы распознования без ограничений идут но требуют инета).
Ответ написан
Комментировать
zoonman
@zoonman
⋆⋆⋆⋆⋆
Если нет подключения к Интернет, то нужно что-то вроде этого cmusphinx.sourceforge.net/wiki

Если есть подключение к сети, то полно скриптов, которые умеют слушать в непрерывном режиме и скармливать услышанное Google Speech API. А дальше дело техники.
Ответ написан
Комментировать
Stalker_RED
@Stalker_RED
Кроме CMU Sphinx есть и другие проекты по распознаванию голоса. Конечно не все они запустятся на Raspberry Pi, но в целом задача решаемая. И вы не первый кто делает подобное:
https://diyhacking.com/best-voice-recognition-soft...
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы