ms-dred
@ms-dred
Вечно что то не то и что то не так...

Как найти/выявить похожие картинки?

На сайте более 150 000 фото, периодически появляются дубли - идентичное фото, фото с ресайзом, фото с кропом, фото с измененным цветом.
Хочу фильтровать такие дубли, готов даже мощности отдельные подключить ради этого, но проблема в том что не знаю с чего начать, куда копать, может есть какие готовые решения для под Node.js, или даже под Node.js+MongoDB где хранятся какие то данные для более быстрого нахождения дублей???
  • Вопрос задан
  • 1200 просмотров
Пригласить эксперта
Ответы на вопрос 3
Комментировать
Anubis
@Anubis
Люблю корейскую кухню и веб-разработку
Как ответили выше, сегодня уже полно готовых велосипедов для этого.
Раньше это делалось например так:
1) При загрузке изображение конвертируется в grayscale (обесцвеченное) и уменьшается в размерах (например, до 10-15 пикселов по наибольшей стороне)
2) Полученная мелкая картинка преобразовывается в хэш
3) По базе ранее загруженных изображений выполняется поиск этого хэша
4а) Если совпадений нет - загрузка подтверждается, в базе делается новая запись
4б) Если совпадения найдены - выдаётся ответ о том, что такое изображение уже есть
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы