Какое подобрать хранилище 3 триллионов событий?

Question

Blowspirit @Blowspirit

Какое подобрать хранилище 3 триллионов событий?

Нужно подобрать хранилище в которое будет поступать большой объем однотипных событий (до 3 миллионов в секунду).
Глубина хранения 1 месяц - это примерно 3 триллиона событий.
Выборка событий будет происходить с использованием фильтров по полям в среднем раз в секунду.
Соответственно хранилище должно уметь горизонтально масштабироваться на 100-1000 узлов, быть надежным и проверенным решением, быть устойчивым к отказам узлов, делать быстро выборку по разным критериям с возможностью сортировки, поддерживать java клиента.

Вопрос задан более трёх лет назад
4270 просмотров

13 комментариев

Подписаться 28 Оценить 13 комментариев

sim3x @sim3x

Дайте определения терминам
"быстро"
"устойчивым к отказам узлов"
"быть надежным и проверенным решением"

И оценочную $

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

"быстро" - поиск не более 5-10 секунд за конкретную дату и не более 30-60 если поиск производится за месяц.
"устойчивым к отказам узлов" - при отказе узла данные не должны теряться, т.е. нужна авто репликация данных
"быть надежным и проверенным решением" - малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается
И оценочную $ - бесплатное и opensource решение

Написано более трёх лет назад
lega @lega

Blowspirit: > малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается

Тогда вам только велосипедить, что многие и делают

Написано более трёх лет назад
nirvimel @nirvimel

до 3 миллионов в секунду

Биржевые тики?
А зачем их хранить так долго? Если в реальном времени не хватает скорости на их обработку, то и в дальнем времени на это не будет. Оправданна очередь на обработку максимум в несколько минут, чтобы сгладить профиль вычислительной нагрузки в моменты "штормов".

Написано более трёх лет назад
Tsimur_S @Tsimur_S

nirvimel: еще возможен Iot и миллион сенсоров)

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

nirvimel: хранятся не тики, а события от устройств. Обработка в реальном времени не нужна, поэтому и храним за месяц

Написано более трёх лет назад
lega @lega

Blowspirit: > а события от устройств
от wifi точек?

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Я ради интереса подпишусь, но не думаю что будет бесплатное и opensource которое по факту решало такие задачи. Это все-таки ну очень специфическая задача при высокой нагрузке - если кто то себе и напишет - вряд ли отдадут в паблик.

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

Blowspirit: в рамках оффтопика - у вас объем хранилища без индексов ~2ПБайт, это как бы не дешево весьма по железу. Почему при этом накладывается ограничение что софт должен быть бесплатным?

Написано более трёх лет назад
lega @lega

Дмитрий Энтелис: Вот и я про тоже

Написано более трёх лет назад
profesor08 @profesor08

Дмитрий Энтелис: похалявить

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

У меня есть пока следующие соображения:
1. поскольку при поиске данных всегда фигурирует id устройства и временной диапазон, то можно это дело хранить в hdfs в структуре типа /id_устройства/день/файл_с_данными. Соответственно нужный файл (~400мб) или файлы мы можем быстро найти, а затем данные в нем мы фильтруем с помощью чего-либо (spark, flink или hive??).
2. Можно хранить данные в кластере с elasticsearch выпилив ненужные поисковые причиндалы (full-text) из структуры данных. Идея такая: создаем каждый день новый индекс(аля база данных в реляционных терминах) где к названии индекса будем в постфиксе добавлять текущую дату. В индексе будет будет где-то 130-150 шардов (т.к. 1 шард это максимум ~2 миллиарда событий). Поисковый запрос в elasticsearch позволяет искать сразу в нескольких индексах (можно использовать соответствующие паттерны в запросе). Плюс в эластике каждое поле уже автоматом является индексом что большой плюс. Тут очень интересно насколько адекватно такой кластер с таким количеством шардов будет работать

Написано более трёх лет назад
Blowspirit @Blowspirit Автор вопроса

Итог: попробовали несколько макетов, самым интересным оказался hadoop.
hdfs - используем для хранения данных, MapReduce - для аналитики

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 7

1 комментарий

Комментировать

4 комментария

Blowspirit @Blowspirit Автор вопроса

Одно событие весит примерно 150 байт. С учетом необходимость большого количества ssd это под вопросом. А если разливать события вручную на диск, то фактически вы предлагаете использовать полностью самописное решение для шардинга, репликации, индексации и тд, что конечно же не комильфо

Написано более трёх лет назад
lega @lega

Blowspirit: > С учетом необходимость большого количества ssd это под вопросом
Можно на HDD, будет медленнее, но тоже быстро, или вы как планировали?, если заливать в БД то размер будет ещё больше.

> полностью самописное
Не полностью (для шардинга и репликации можно gridfs например), но да, для большой нагрузки все делают кастомные решения, думаете поиск гугла или яндекса на каком нибудь sphinx/elastic работает что ли?

Хотя можете попробовать что-то готовое "тормозное", (покажите мне хоть один сервер БД который может 27 млн/сек на одной ноде)

Написано более трёх лет назад
Дмитрий Энтелис @DmitriyEntelis

lega sdd с "файликами" упрется в iops очень быстро

Написано более трёх лет назад
lega @lega

Дмитрий Энтелис: Упрется в последнюю очередь, другие решения упрутся гораздо раньше в 99%.
+ некто не отменял кеширование и балансинг.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Java

+1 ещё

Простой
Что лучше учить новичку Java или Kotlin?
- 1 подписчик
- 8 часов назад
- 39 просмотров
2

ответа
Java

Простой
Всегда ли нужно использовать последнюю версию JDK?
- 1 подписчик
- 18 часов назад
- 85 просмотров
3

ответа
Android

+3 ещё

Средний
Как получить разрешение для автостарта (чтобы при старте оно загружалось) для приложения под Андройд (Android)?
- 1 подписчик
- 23 апр.
- 83 просмотра
0

ответов
Java

Простой
Как сделать глобальный чат Chatty?
- 1 подписчик
- 20 апр.
- 81 просмотр
0

ответов
Java

+2 ещё

Простой
Selenide + Spring Boot. Как объявить страницу через метод open(), если класс страницы является bean?
- 1 подписчик
- 19 апр.
- 49 просмотров
0

ответов
Java

+1 ещё

Простой
Почему не видит WebSecurityConfigurerAdapter при попытке импортировать его в класс SecurityConfig?
- 1 подписчик
- 19 апр.
- 68 просмотров
1

ответ
Java

Простой
Почему происходит два пустых вывода при чтении с клавиатуры?
- 1 подписчик
- 19 апр.
- 53 просмотра
1

ответ
NoSQL

+1 ещё

Простой
Как в ScyllaDB создавать функцию и установить её по умолчанию?
- 1 подписчик
- 18 апр.
- 33 просмотра
0

ответов
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 204 просмотра
3

ответа
Java

+1 ещё

Простой
Как правильно внедрять зависимости в классы, зависящие от не-бинов?
- 1 подписчик
- 16 апр.
- 73 просмотра
1

ответ
Показать ещё Загружается…

Lead Java

Bell Integrator • Ульяновск

До 400 000 ₽

Lead Java

Bell Integrator • Хабаровск

До 400 000 ₽

Lead Java

Bell Integrator • Ижевск

До 400 000 ₽

Подключить сервер к сети

27 апр. 2024, в 02:39

1500 руб./за проект

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Написать модуль подключения матрицы Sony к ПЛИС (Verilog)

26 апр. 2024, в 21:30

15000 руб./за проект

Дайте определения терминам
"быстро"
"устойчивым к отказам узлов"
"быть надежным и проверенным решением"

И оценочную $
"быстро" - поиск не более 5-10 секунд за конкретную дату и не более 30-60 если поиск производится за месяц.
"устойчивым к отказам узлов" - при отказе узла данные не должны теряться, т.е. нужна авто репликация данных
"быть надежным и проверенным решением" - малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается
И оценочную $ - бесплатное и opensource решение
Blowspirit: > малоизвестное решение, которое не решало схожего масштаба задачи не рассматривается

Тогда вам только велосипедить, что многие и делают
до 3 миллионов в секунду

Биржевые тики?
А зачем их хранить так долго? Если в реальном времени не хватает скорости на их обработку, то и в дальнем времени на это не будет. Оправданна очередь на обработку максимум в несколько минут, чтобы сгладить профиль вычислительной нагрузки в моменты "штормов".
nirvimel: еще возможен Iot и миллион сенсоров)
nirvimel: хранятся не тики, а события от устройств. Обработка в реальном времени не нужна, поэтому и храним за месяц
Blowspirit: > а события от устройств
от wifi точек?
Я ради интереса подпишусь, но не думаю что будет бесплатное и opensource которое по факту решало такие задачи. Это все-таки ну очень специфическая задача при высокой нагрузке - если кто то себе и напишет - вряд ли отдадут в паблик.
Blowspirit: в рамках оффтопика - у вас объем хранилища без индексов ~2ПБайт, это как бы не дешево весьма по железу. Почему при этом накладывается ограничение что софт должен быть бесплатным?
У меня есть пока следующие соображения:
1. поскольку при поиске данных всегда фигурирует id устройства и временной диапазон, то можно это дело хранить в hdfs в структуре типа /id_устройства/день/файл_с_данными. Соответственно нужный файл (~400мб) или файлы мы можем быстро найти, а затем данные в нем мы фильтруем с помощью чего-либо (spark, flink или hive??).
2. Можно хранить данные в кластере с elasticsearch выпилив ненужные поисковые причиндалы (full-text) из структуры данных. Идея такая: создаем каждый день новый индекс(аля база данных в реляционных терминах) где к названии индекса будем в постфиксе добавлять текущую дату. В индексе будет будет где-то 130-150 шардов (т.к. 1 шард это максимум ~2 миллиарда событий). Поисковый запрос в elasticsearch позволяет искать сразу в нескольких индексах (можно использовать соответствующие паттерны в запросе). Плюс в эластике каждое поле уже автоматом является индексом что большой плюс. Тут очень интересно насколько адекватно такой кластер с таким количеством шардов будет работать
Итог: попробовали несколько макетов, самым интересным оказался hadoop.
hdfs - используем для хранения данных, MapReduce - для аналитики

Answer 1 · 2017-02-06 11:00:25

Yandex Clickhouse (тут на веру Яндексу только, зато как раз под задачу)
Aerospike
еще начать можно с DynamoDB, там готово все, только плати

только с 3 трлн и 5-10 сек очень не уверен, так или иначе придется что-то предобрабатывать

Answer 2 · 2017-02-06 13:30:14

Tarantool и AeroSpike ? Или возможно стоит посмотреть в сторону time series database?
https://www.influxdata.com/influxdb-vs-cassandra-b...
Может ещё кассандра справится с безумным количеством серверов, но вообще больше миллиона записей в секунду это на данный момент слабо реализуемо.

Answer 3 · 2017-02-06 15:15:55

Скорость ssd до 550Mb/sec, если события по 20б, то можете по файликам разливать ~27 млн событий в сек (одного канала не хватит чтобы нагрузить)

Выборка событий будет происходить с использованием фильтров по полям в среднем раз в секунду.

Разливайте в "доль" фильтров и будет норм.

Answer 4 · 2017-02-07 02:48:07

index0h @index0h

PHP, Golang. https://github.com/index0h

KDB+

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2017-02-15 08:35:42

Akumuli может записывать 4.5 миллиона событий в секунду на единственном m3.2xlarge инстансе (если события представимы в виде комбинации набора тегов, метки времени и числа с плавающей точкой).

Answer 6 · 2017-02-06 13:19:20

Максим Тимофеев @webinar

Учим yii: https://youtu.be/-WRMlGHLgRg

https://www.oracle.com/database/solutions/index.html

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2017-02-06 13:25:26

Петр @petermzg

Самый лучший программист

Azure Datalake

Ответ написан более трёх лет назад

Комментировать

Какое подобрать хранилище 3 триллионов событий?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт