@immelnikoff
Изучаю БД

Какой хэш-алгоритм обладает минимальной вероятностью коллизии для очень похожих файлов фото / видео?

В хранилище имеется 50 млн. фото и 50 млн. видео-роликов. Хэш-сумма каждого фото и видео нужна в целях гарантии неизменности данных. Под коллизиями я понимаю не совпадение хэш-сумм разных фото или видео, а случайное изменение данных на HDD (например, слетел пиксель на фото), при котором хэш-сумма не изменилась (есть такая теоретическая вероятность). Какой хэш-алгоритм дает минимальную вероятность подобной коллизии?
ps. Криптографическая стойкость алгоритма не нужна. Нужна только минимальность вероятности коллизии при разной степени похожести данных (фото и видео).
pps. Важно не количество уникальных значений хэш-суммы данного алгоритма. Важно, чтобы для любого файла-изображения, во-первых, коллизий было как можно меньше в расчете на каждый бит выходного значения данного хэш-алгоритма, а во-вторых, чтобы распределение коллизий по всему пространству теоретически возможных изображений для него было как можно более равномерным, а не имело ярко-выраженный "купол" с центром из данного файла.
  • Вопрос задан
  • 278 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы