Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Question

Oleg Wock @OlegWock

Python, Java+Android, Frontend

Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Имеется железка в виде Raspberry Pi 3. Стоит распбиан и есть задача постоянно слушать микрофон и когда произносят какую-то фразу, реагировать (запускать скрипт, например). Как это лучше организовать? Если нет подключения к интернету?

Окей, я уточню. Интернет есть, но проблема в том, что скармливать ему 24-х часовую запись я не могу (скорость так себе, ограничение по трафику). Поэтому я хочу научить его узнавать мой голос с одной единой командой (обращением, что-то типа Окей гугл), которая уже будет запускать питон-скрипт (мой), который будет записывать остальной текст и распознавать через сервисы гугля или яндекса

Вопрос задан более трёх лет назад
1939 просмотров

3 комментария

Подписаться 5 Оценить 3 комментария

Решения вопроса 3

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Linux

+4 ещё

Простой
Как исправить ошибку при установке pam_sqlite?
- 1 подписчик
- 3 часа назад
- 7 просмотров
1

ответ
Linux

+1 ещё

Простой
Хочу заняться графической оболочкой для линукс. Есть ли какая-нибудь база дистрибутива?
- 1 подписчик
- 8 часов назад
- 87 просмотров
3

ответа
Linux

Средний
Linux на SSD рядом с Win10, на внешний HDD или виртуализация?
- 1 подписчик
- 18 часов назад
- 136 просмотров
6

ответов
Linux

+1 ещё

Простой
Что делать, если пишет «error: unknown filesystem Enering rescue mode... grub rescue>»?
- 1 подписчик
- вчера
- 112 просмотров
2

ответа
Linux

+3 ещё

Простой
Как вернуть обратно gnome 44 в Kali linux?
- 1 подписчик
- вчера
- 66 просмотров
0

ответов
Linux

+1 ещё

Средний
Astra Linux — как избавиться от шума в HDD?
- 2 подписчика
- вчера
- 330 просмотров
4

ответа
Linux

+2 ещё

Простой
Что выбрать для проекта Windows Embedded или Linux?
- 1 подписчик
- вчера
- 167 просмотров
4

ответа
Linux

+1 ещё

Средний
Как переименовать файлы и папки с одинаковым именем, но разным регистром?
- 1 подписчик
- вчера
- 111 просмотров
0

ответов
Linux

Простой
Почему не отрабатывает REISUB?
- 1 подписчик
- вчера
- 67 просмотров
1

ответ
Linux

+1 ещё

Средний
Как выглядят данные об авторизации linux?
- 1 подписчик
- 17 апр.
- 161 просмотр
2

ответа
Показать ещё Загружается…

Программист C для Embedded Linux

Radiofid • Санкт-Петербург

от 120 000 до 180 000 ₽

Linux Администратор DevOps

ИМАГ • Москва

от 150 000 до 170 000 ₽

Программист C/C++ embedded Linux

РТК Автоматика • Москва

от 170 000 до 250 000 ₽

Английская версия для сайта на WordPress

20 апр. 2024, в 03:34

8000 руб./за проект

Доработать клиентское приложение для GTA 5 на C#

20 апр. 2024, в 00:51

1000 руб./за проект

Верстка и логика формы выбора билетов в зале для покупки

20 апр. 2024, в 00:43

10000 руб./за проект

Изобретаете свой СОРМ с блэкджеком?)
rivalsm: Я бы тоже такую штуку использовал. Когда открыто дофига окон (штук по 40) и переключаться между ними сплошная мука. А так - назвал окно и пожалуйста!
Захаров Александр: лучше на неё повесить 20 килограмм тротила. К вам вламываются спецслужбы и произносишь "жопа" =D

Answer 1 · 2017-01-09 23:06:17

Без интернета только если у вас есть бюджет в пару миллионов зеленых на серверную ферму и оплату работы стада программистов для написания распозновалки голоса.
Если в условиях задачи есть оговорка реагировать только на конкретно заданные слова которые заранее заданы для заранее известного голоса и интонации то решения есть. К примеру CMU Sphinx(сфинкс) но работает оно откровенно говоря несколько странно с Русским и вообще начинает очень плохо работать когда число команд переходит пару десятков (по крайней мере так было когда я его смотрел довольно давно). Порта на армы вроде не было но скорее всего добрые люди есть.
Есть еще самый простой вариант, заюзать яндекс\гугл\... сервисы. Из плюсов удобное апи, огроменная точность(на фоне любых оффлайн решений). Из минусов нужен инет и забесплатно ограничения на число запросов.
Еще можно задействовать андроид под это дело(точно не помню но вроде бы сервисы распознования без ограничений идут но требуют инета).

Answer 2 · 2017-01-09 23:01:51

Если нет подключения к Интернет, то нужно что-то вроде этого cmusphinx.sourceforge.net/wiki

Если есть подключение к сети, то полно скриптов, которые умеют слушать в непрерывном режиме и скармливать услышанное Google Speech API. А дальше дело техники.

Answer 3 · 2017-01-10 05:55:57

Кроме CMU Sphinx есть и другие проекты по распознаванию голоса. Конечно не все они запустятся на Raspberry Pi, но в целом задача решаемая. И вы не первый кто делает подобное:
https://diyhacking.com/best-voice-recognition-soft...

Как организовать непрерывную прослушку микрофона и реакцию на определенное слово?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт