Как распознать картинку с камеры на javascript и найти её в базе?

Question

Romansov @Romansov

Как распознать картинку с камеры на javascript и найти её в базе?

Очень долго пытаюсь решить данную задачу. Суть задачи заключается в том, чтобы с камеры телефона (при наведении) в браузере распознать, проверить по базе и узнать ID картинки, которая хранится на сервере. Перерыл кучу инфы, но не нашел хорошо работающего решения. Пробовал перцептивное хеширование (глупость, да), сейчас рою в сторону opencv.js и подобных фрэймворков, но увы, ничего пока не получается из-за того, что не могу сопоставить последовательность действий.

Вопрос задан более трёх лет назад
1382 просмотра

Комментировать

Подписаться 11 Средний Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

JavaScript

+1 ещё

Простой
Как сформировать маску, используя регулярное выражение?
- 1 подписчик
- 39 минут назад
- 28 просмотров
0

ответов
JavaScript

+1 ещё

Средний
При создании PWA ошибка Cannot read properties of null (reading 'prompt'), в чем проблема?
- 1 подписчик
- 3 часа назад
- 27 просмотров
0

ответов
JavaScript

+1 ещё

Средний
Как сделать так, чтобы клик по object передавался родителю?
- 1 подписчик
- 3 часа назад
- 85 просмотров
2

ответа
JavaScript

+1 ещё

Средний
Как сделать программную навигацию без изменения url в vue-router + vue3?
- 1 подписчик
- 14 часов назад
- 38 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как скачать pdf из встроенного просмотрщика на сайте?
- 1 подписчик
- 21 час назад
- 128 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Как построение маршрута на 2GIS API v2.0?
- 1 подписчик
- 22 часа назад
- 51 просмотр
0

ответов
JavaScript

Средний
Эффект наложения блоков?
- 1 подписчик
- вчера
- 110 просмотров
2

ответа
JavaScript

+2 ещё

Средний
Как изменить содержание блока програмно со свойством contentEditable?
- 1 подписчик
- вчера
- 89 просмотров
0

ответов
JavaScript

+4 ещё

Средний
Как сделать правильное динамическое масштабирование ion-range в зависимости от ширины колонок линии со значениями?
- 1 подписчик
- вчера
- 48 просмотров
0

ответов
JavaScript

Простой
Как после сабмита очистить поле type="tel" и показать очищенную маску?
- 2 подписчика
- вчера
- 72 просмотра
0

ответов
Показать ещё Загружается…

JavaScript разработчик

SummerWeb • Ярославль

от 100 000 до 140 000 ₽

JavaScript разработчик

вАйТи

от 5 000 до 25 000 ₽

JavaScript Fullstack

OnClass

от 200 000 до 600 000 ₽

Разработать сложный сервис на Django

25 апр. 2024, в 12:03

75000 руб./за проект

Помощь СММ-специалиста

25 апр. 2024, в 11:49

25000 руб./за проект

Помощь с СЕРМ

25 апр. 2024, в 11:37

40000 руб./за проект

Answer 1 · 2019-10-29 11:14:31

Romansov @Romansov Автор вопроса

Решил проблему с помощью ml5js, а именно примером "Feature Extractor" на гитхабе.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-10-23 06:24:56

Потому что задача не такая простая как хотелось бы, да, перцептивное хеширование и opencl верное направление, но ваша проблема именно в том что вы работаете с камерой а не типличными условиям и готовыми картинками.

Камера - это повороты и перспективные искажения, проблемы с неравномерной яркостью и мерцанием освещения, инертностью матрицы и глюки алгоритмов пост обработки в смартфонах.

Вы зависните глубоко и на долго тупо на определении границ вашего изображения, и хорошо, если бы оно было бы геометрически простым, типа прямоугольник

Answer 3 · 2019-10-23 12:11:32

Ну если сети, то тебе надо распознавать что за объекты в кадре https://github.com/tensorflow/models/blob/master/r... и в первую итерацию искать объекты с таким же числом и типом. Во вторую сравнивать векторы с позициями https://docs.scipy.org/doc/numpy/reference/generat... и ранжровоать по этому расстоянию.

Хотя скорее всего это все надо, надо просто нормализировать изображения чтобы убрать искажения и потом искать похожие по цветовому профилю, по крайней мере опенсусрсные решения так делают - www.lire-project.net Пример https://github.com/soruly/trace.moe объяснение как работает https://go-talks.appspot.com/github.com/soruly/sli...

Answer 4 · 2019-10-23 21:00:44

Вот Ваш ответ:

Перерыл кучу инфы, но не нашел хорошо работающего решения. Пробовал перцептивное хеширование (глупость, да), сейчас рою в сторону opencv.js и подобных фрэймворков, но увы, ничего пока не получается из-за того, что не могу сопоставить последовательность действий. Хелп плес.

Не пытайтесь рыть и искать работающее решение.
Научитесь понимать логику по-шагам.

PS: Чтобы ускорить обработку данных на js - используйте emscripten.

Как распознать картинку с камеры на javascript и найти её в базе?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт