Как вам мой алгоритм хэширования?

Question

Tolik @Diel

Как вам мой алгоритм хэширования?

Создал свой собственный алгоритм хэширования. При смене одного бита полностью меняется хэш, длина его всегда 64 (если не считать пробелов). На диапазоне 00000..99999 ни одной коллизии. Правда работает медленно (относительно sha* например). Но с другой стороны, это защита от подбора или поиска тех самых коллизий. Вот собственно код.

P.S. Делал всё как-нибуть и по этому константы являются рандомными числами, получеными питоновским скриптом:
["%.8X" % random.randint(0, 2 ** 32 - 1) for i in range(0, 8)]

P.P.S. Если понравился, можете спокойно юзать. Я не из АНБ :)

Модеры, вы зачем ответы удаляете? Я так ржал, а вы убрали и всё. Даже если там жесткая критика, смешно ведь. Если можно, верните ответы=)

UPD: Коллизии -- одно. Но я встречал в хэшах по 3-5 однаковых цыфр под ряд (в одном из восьми чисел, из которых состоит хэш). Я уверен, что это дыра. Попробую ее заделать

Вопрос задан более трёх лет назад
2567 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 4

6 комментариев

Tolik @Diel Автор вопроса

Спасибо, на данный момент это самый полезный ответ. Я всего лишь учусь в школе (последний класс) по этому быть криптографом мне пока не суждено. Написал что смог

Написано более трёх лет назад
jcmvbkbc @jcmvbkbc

@Diel Чтобы избежать известных глупых ошибок имеет смысл изучать существующие алгоритмы/их реализации, задаваясь вопросом, почему то или иное место сделано так, как сделано. И это применимо не только к криптографии (:

Написано более трёх лет назад
Tolik @Diel Автор вопроса

@jcmvbkbc а согласитесь всё-таки, подбирать мое дело не просто:) Только если большой дядька не найдет большую дыру

Написано более трёх лет назад
jcmvbkbc @jcmvbkbc

> согласитесь всё-таки, подбирать мое дело не просто
@Diel если вы готовы назначить денежный приз за нахождение коллизии, скажем $1000, я бы поучаствовал. (:

Написано более трёх лет назад
Tolik @Diel Автор вопроса

@jcmvbkbc сам могу поставить ноут на ночь, пусть пишет в файл. На следующий день бы поискал одинаковые строки. Или бы написал полностью автоматический скрипт

Написано более трёх лет назад
jcmvbkbc @jcmvbkbc

@Diel конечно можете, однако это упражнение даст вам не ответ на вопрос "сложно ли подобрать строку, дающую коллизию", а ответ на вопрос "нет ли коллизий среди рассмотренных вами строк".

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Парсинг

+1 ещё

Средний
Как лучше сделать проверку строки в файле?
- 1 подписчик
- 2 минуты назад
- 1 просмотр
0

ответов
C

+1 ещё

Средний
Нужен ХОРОШИЙ rpc для языка Си, есть ли решения?
- 1 подписчик
- 2 часа назад
- 55 просмотров
2

ответа
C++

+2 ещё

Средний
Почему GCC не видит встроенную атомарную операцию?
- 2 подписчика
- 11 часов назад
- 229 просмотров
2

ответа
C

+1 ещё

Простой
Как конвертировать из DEC в HEX ASCII?
- 1 подписчик
- вчера
- 110 просмотров
3

ответа
C

Простой
Почему постоянно выводится расстояние 0(Алгоритм Дейкстры для городов)?
- 3 подписчика
- 22 апр.
- 881 просмотр
1

ответ
Linux

+1 ещё

Простой
Как в io_uring отправить sqe, чтобы sqe выполнилось через 3 секунды после io_uring_submit?
- 2 подписчика
- 20 апр.
- 66 просмотров
1

ответ
C++

+1 ещё

Простой
Возможно ли сделать nested enum c/c++?
- 2 подписчика
- 20 апр.
- 69 просмотров
1

ответ
C

+1 ещё

Простой
Как отправить запрос на терминал Vendotek?
- 2 подписчика
- 18 апр.
- 179 просмотров
0

ответов
C++

+2 ещё

Средний
Как сделать маштабирование относительно центра экрана?
- 1 подписчик
- 18 апр.
- 75 просмотров
1

ответ
C

+1 ещё

Простой
Как вывести значение указателя без иннициализации?
- 1 подписчик
- 12 апр.
- 108 просмотров
4

ответа
Показать ещё Загружается…

Программист C для Embedded Linux

Radiofid • Санкт-Петербург

от 120 000 до 180 000 ₽

Senior Developer C

E1 CARD

До 4 400 $

Разработчик C/C++ c GStreamer/Deepstream

Передовая Инженерная Школа МФТИ

До 250 000 ₽

Unity очень простая игра

24 апр. 2024, в 19:51

1000 руб./за проект

Парсинг поисковой выдачи Яндекс

24 апр. 2024, в 19:40

5000 руб./за проект

Разработка приложения на Flutter

24 апр. 2024, в 19:18

50000 руб./за проект

Answer 1 · 2014-08-09 22:13:06

Внутреннее состояние в unsigned int и char *data -- это ошибки: char бывает знаковым и беззнаковым, а int может иметь разную ширину в зависимости от системы.
Дальше, вы замешиваете входные данные в хэш побайтово, это дыра для дифференциального криптоанализа.
Дальше, состояние вы тащите в интах, а за время хеширования одного байта у вас состояние не прокручивается полностью (ваши сдвиги, максимум на 3, за цикл хеширования сдвинут состояние максимум на 24 бита из 32). Мало того, что это неряшливо, это также значит, что старшие и младшие части слов хеша будут иметь разную структуру.
Короче, даже без углубления в анализ видно, что алгоритм непродуман и слаб.

Правда работает медленно (относительно sha* например).

При том, что даже sha1 делает больше раундов, чем ваше произведение.

если не будет совпадений, то возможно он нормальный

К тому же вам, очевидно, не хватает знаний о том, как оценивается качество криптографических хеш-алгоритмов.

Answer 2 · 2014-08-09 21:51:23

Спасибо, давно так не смеялся, без обид, но таких хеш функций можно в день штук 10 делать.
По коду ничего особенного не вижу. Вам скучно было, вот и поделились?

Answer 3 · 2014-08-09 22:10:48

Длина 64 в каких единицах? В битах? Тогда диапазон 00000..99999 входных значений для поиска коллизий слишком мал.

Код тоже так себе, хеш должен считаться в цикле без счетчиков.
А тут, если подать слишком большой объем данных, то произойдет переполнение со всеми вытекающими.

Answer 4 · 2014-08-10 09:58:16

Во-первых, для школьника неплохо. Во-вторых, лично мне непонятна сфера применения этой хэш-функции. Для проблем, связанных с безопасностью, уже есть проверенные решения. Для проблем, связанных с детерминистским распределением объектов по контейнерам (пример: разделение нагрузки а-ля etherchannel, ECMP) она слишком медленная. В-третьих, автор будет еще большим молодцом, если самостоятельно найдет коллизии.

константы являются рандомными числами

На мой взгляд, попытка добавить "случайности" в алгоритм без его всестороннего исследования преждевременна и может вести к ложной уверенности в "безопасности" алгоритма.

Как вам мой алгоритм хэширования?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт