На что сменить MongoDB

Question

Slader @Slader

На что сменить MongoDB

Сейчас на сервере (2хE5-2630, 128Гб RAM, SAS) стоит MongoDB 2.4.1
В ней две коллекции (в разных бд):
— Коллекция-1: 70 млн. записей (120 insert/s, 60 find/s, база с индексами ~ 9 Гб).
— Коллекция-2: 40 млн. записей (50 insert/s, 40 find/s, база с индексами ~ 11 Гб).

Цифры вроде не большие для данного железа. Вообще-то, запросов на чтение приходит на порядок больше, но по остальным информация берется из кэша (Redis). До монго доходит только в случае кэш промаха.

Проблема в том, что постоянно несколько операций find выполняются по 180 — 600 мс. Судя по отчетам профайлера и логам они ожидают, пока не освободится writing lock.

Sun Apr 14 13:40:44.859 [conn3581] query db1.coll1 query: { _id: "14638g27189a6a957c6a792151df31b7" } ntoreturn:1 idhack:1 keyUpdates:0 locks(micros) r:188697 reslen:105 188ms

К базе вообще делаю только findOne или insert. Объем данных в insert не превышает 120 байт.

iostat -x

rrqm/s   wrqm/s     r/s      w/s       rkB/s    wkB/s      avgrq-sz  avgqu-sz   await     r_await  w_await   svctm   %util

0,01       5,55          0,57   27,60    35,60    1531,59   111,28      0,41           14,46    8,01       14,60       1,61       4,53

Вопрос: что делать? В дальнейшем объем данных вырастет до 500 — 1000 млн записей. И количество обращений на чтение до 10 тыс/сек.
Мне нужна БД с очень низкой латентностью для чтения по ключу. Никаких сложных выборок. Нужен backend для кэша. А монго со своим per-database write lock все портит.

Еще вариант, читать только со slave ноды. А писать на master. Но боюсь столкнуться с задержками при репликации данных, и, как следствие, с неконсистентными данными.

Что посоветуете? HBase, Hypertable? Нужно уложиться в максимум 2-5 мс при чтении из БД.

Вопрос задан более трёх лет назад
14139 просмотров

1 комментарий

Подписаться 23 Сложный 1 комментарий

Пригласить эксперта

Ответы на вопрос 18

2 комментария

1 комментарий

2 комментария

Комментировать

5 комментариев

Slader @Slader Автор вопроса

Шардинг внутри монги не особо помогает. Ключи нормально распределены, поэтому блокируется, конечно, меньше. Но все равно, блокировки есть.
Никто не спорит, что при увеличении количества инсертов надо будет делать шардинг.
Но то, что при 120 insert/s я уже не могу получить доступ на чтение к данным, которые целиком находятся в оперативной памяти, — это за гранью моего понимания.

Написано более трёх лет назад
necromant2005 @necromant2005

Как есть.
Еще можно съемулировать отложеную запись. Тоесть вставлять новые данные во временную колекцию и раз в 1-5-15 минут переность в остновную.
Соответсвенно выборки будут выглядеть как:
выборка из большой базы + выборка ново вставленных.

Т.к. размер коллекции с новыми данными << меньше основной базы. Что привете к сщественному росту проиводительности чтения (также можно не использовать индексы для операция поиска)

Написано более трёх лет назад
Slader @Slader Автор вопроса

Вот так и сделал сейчас. Чтение из кэша. А при промахе — из основной БД. Запись — в отдельную бд. Раз в час — миграция данных.
Но, мне кажется, это костыль.

Написано более трёх лет назад
necromant2005 @necromant2005

Монга не прячет от тебя внутренее устройство.
Sphinx с дельта индексами делает тоже самое, просто логика спрятана.
Cassandra && Riak вытявают за счет нод.
Чудес не бывает.

Написано более трёх лет назад
Slader @Slader Автор вопроса

а жаль :(

Написано более трёх лет назад

Комментировать

6 комментариев

realduke @realduke

У вас, кстати, довольно вменяемые требования по латентности, странно, что получаете такие результаты.

Написано более трёх лет назад
Slader @Slader Автор вопроса

Зато эти требования довольно строгие. Необходимо, чтобы все запросы на выборку данных по ключу укладывались… ну хоть в 10мс. А лучше в 1-3мс. Если не укладываются — срабатывает внешний таймаут.
Задержка между нодами 0.1 мс, так что с сетью проблем нет.

Сервер один — это пока он один. Мы не можем оценить, сколько и каких нам потребуется серверов, так как на довольно мощном железе столкнулись с проблемами на «детских» нагрузках.

Я не понимаю, почему монго заставляет мои операции выборки ждать освобождения write lock, если: 1) я сделал insert и выбираю точно не эту запись; 2) Вся бд и индексы легко помещается в памяти.

Если она так иногда подтормаживает, когда памяти больше, чем надо, то что будет, когда размер БД превысит размер RAM? 10-20 секунд на некоторые операции?

Написано более трёх лет назад
realduke @realduke

А я просто не первый раз слышу о проблемах, подобных вашим, поэтому на MongoDB смотрю скептически еще с первого знакомства, когда при выборе горизонтально масшатибируемого NoSQL решения она фейлилась на простых тестовых данных. Тогда были соотвествующие багрепорты, но вроде всё упиралось в архитектуру. И тоже как раз было связано с локами. Вообще решения, которые не могут гарантировать «предсказуемых результатов» при масштабировании трудно назвать ориентированными на highload.

Раз данные у вас так быстро растут, то может быть стоит обратить внимание на решения типа Riak или Voldemort?

Написано более трёх лет назад
realduke @realduke

Riak по тестам вроде быстрее на чтение, чем Voldemort, т.е. как раз ваш случай.

Написано более трёх лет назад
Slader @Slader Автор вопроса

На Riak тоже отзывы не очень позитивные. На средних базах он хорош. А когда число записей превышает 50 миллионов, уже начинается просадка по производительности.
Впрочем, это все с чужих слов. Сами не тестили.

Написано более трёх лет назад
realduke @realduke

Просадка будет в любом случае, но вот насколько при конкретном дизайне приложения — вопрос. Тестить нужно в любом случае. Кластер поднимается легко. Решение в любом случае за вами. Но несколько успешных историй перехода в частности с MongoDB на Riak я слышал. Но у них разная начинка, всё сильно зависит от архитектуры. В вашем случае, если я правильно понял, нужно persistent key-value store, таких много. У меня есть знакомые, которые вообще юзали leveldb напрямую, кстати, надо выяснить насколько успешно.

Написано более трёх лет назад

Комментировать

4 комментария

Slader @Slader Автор вопроса

У нас выбор одной записи по первичному ключу. То есть по основному индексу. Если он не работает, то зачем тогда БД?

Написано более трёх лет назад
Пума Тайланд @opium

Может вам тогда запустить несколько нод монго на одном сервере и шардинг.
Не очень понятно что за локи у вас, по идее инсерт лочит только на запись, но не чтение.
По крайней мере так написано в документации.
docs.mongodb.org/manual/faq/concurrency/
Сил сейчас нет развернуть по быстрому тестовую монгу чтобы проверить.

Написано более трёх лет назад
Slader @Slader Автор вопроса

операции чтения тоже ожидают, пока не освободится writing lock

Написано более трёх лет назад
Slader @Slader Автор вопроса

What type of locking does MongoDB use?
However, when a write lock exists, a single write operation holds the lock exclusively, and no other read or write operations may share the lock.

По той же ссылке. В самом начале написано.

Написано более трёх лет назад

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

NoSQL

+1 ещё

Простой
Как в ScyllaDB создавать функцию и установить её по умолчанию?
- 1 подписчик
- 19 часов назад
- 20 просмотров
0

ответов
MongoDB

Простой
Как упростить запрос к БД?
- 1 подписчик
- 12 апр.
- 80 просмотров
1

ответ
MongoDB

Простой
Как проверить данные перед записью в mongoDB?
- 1 подписчик
- 12 апр.
- 45 просмотров
1

ответ
MongoDB

Средний
Как сделать выборку из двух коллекций в MongoDB?
- 1 подписчик
- 10 апр.
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Ка решить проблему с тем, что MongoClient не может подключиться к MongoDB Altus?
- 2 подписчика
- 07 апр.
- 386 просмотров
1

ответ
Системное администрирование

+3 ещё

Средний
Можно ли изменить путь создания hrl файлов?
- 2 подписчика
- 26 мар.
- 69 просмотров
1

ответ
Python

+1 ещё

Простой
Ошибка с pymongo?
- 1 подписчик
- 19 мар.
- 57 просмотров
0

ответов
JavaScript

+3 ещё

Простой
Запуск компьютера с удаленным доступом и некоторыми службами. Как это провернуть максимально правильно?
- 2 подписчика
- 07 мар.
- 174 просмотра
1

ответ
Node.js

+1 ещё

Простой
Node.js mongodb почему не работает connectionClosed?
- 1 подписчик
- 04 мар.
- 83 просмотра
1

ответ
MongoDB

Простой
Compass: бесконечное подключение к серверу mongodb?
- 1 подписчик
- 28 февр.
- 32 просмотра
1

ответ
Показать ещё Загружается…

Backend Developer (Node.js), Remote 🔥

Fundraise Up

от 3 800 до 6 300 $

Senior Backend-разработчик (NestJS)

Эволюшн менеджмент

от 200 000 до 300 000 ₽

Опытный Golang-разработчик

Finandy

от 5 000 $

Нужен директолог с опытом работы

19 апр. 2024, в 10:02

6000 руб./за проект

Помощь с парсингом XML файла яндекс товаров

19 апр. 2024, в 09:46

500 руб./за проект

Обработать массив фотографий

19 апр. 2024, в 08:46

5000 руб./за проект

Вы два года назад это спрашивали, и коллеги в ответах для вас перечислили половину существующих БД :) Вы в итоге решили проблему с медленным find( )?

Answer 1 · 2013-04-14 14:58:06

Потому что 1 миллиард ключей — это уже 166 гигабайт. Вполне нормально для сервера с 256Гб.
Но если по каждому ключу еще и данные хранить, то уже не впишемся по объему. У нас максимум 512Гб можно установить на мать.
Можно, конечно, делать user-level sharding для redis или использовать memcached. Думаем теперь и над этим.

С другой стороны, весь миллиард хранить в памяти не надо совсем. Из него активных — 100 млн. максимум. А остальное все же хотелось бы хранить в бд. И если вдруг потребуется — быстро вычитать и положить в кэш.

Возможно, нам стоит перейти на другой тип БД? Нам нужна отложенная запись (только insert) и быстрое (не более 2 мс) чтение. SSD готовы поставить, лишь бы помогло.
Ведь insert делается сначала в кэш. И все ноды забирают данные из кэша. Так что не особо важно, через сколько БД запишет данные.
А вот минимальная задержка при кэш промахе очень важна.

Answer 2 · 2013-04-14 16:22:32

amakhnach @amakhnach

смотрите в сторону Cassandra DB

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2013-04-14 17:51:10

BlessMaster @BlessMaster

Не пробовали «играться» с fsync?

Ответ написан более трёх лет назад

2 комментария

Answer 4 · 2013-04-14 14:43:16

Yuri Shikanov @dizballanze

Software developer at Yandex

Почему бы полностью не перейти на Redis? Память сейчас дешёвая.

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2013-04-15 09:45:03

Глобальная проблема опарий щаписи в том что каждая вставка заставляет перестраивать индексы.
Поэтому единстенная возможно решить проблему кардинально — это бить на части базу(шардинг), что приводит к тому что опареции записи распределяются за все шарды (желательно развномеррно, зависит от алгоритма выбора ключей) и как результат:
количество_записей_на_1_ноду = общее_количество_записей/количество_нод
Тоесть для 10000к в секунду и 100 нод — 10000/100 = 100 операйций записи в секунду.

Как бы других путей маштабирования записи — нет.
opium — правильно предложил, самый простой вариант шардинг внутри самой монги (это приведет к блокировке только части)
Cassadra / Riak возможно были бы более подходящими, но все опять же кластерные решения: больше нод — выше производительность.

Ну и в качестве странности: жить на одном сервере — с пробелмами записи не получится.

Answer 6 · 2013-04-18 15:07:14

Emmaseven @Emmaseven

Мега производительное хранилище Ключ => Значение fallabs.com/kyototycoon/

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2013-04-23 12:49:25

При таком железе, почему бы не использовать MySQL или Postgre c секционированием данных блоками по 1М-10М, сделав ID инкрементарный BIGINT первичным ключом и поле данных, фиксированного размера(fixed), тогда поиск будет сводиться по сути к выбору нужной секции по iD и выбору нужной записи по формуле id*row_len. Это будет работать очень быстро даже с диска при условии, что файлы таблицы не будет фрагментированы физически на диске, ну а если из памяти не думаю что будет чем то уступать Mongo. Но естественно надо тестить

Постоянные коннекты тут будут обязательны я думаю.

Answer 8 · 2013-10-17 14:08:28

www.tokutek.com/products/tokumx-for-mongodb/
Ужимает бд примерно втрое, намного лучше на запись, намного лучше работает mongos

Answer 9 · 2013-11-15 14:28:24

Попробуй Aerospike http://www.aerospike.com
Желательно иметь машины с болшим количеством ОП и SSD
Community edition ограничивает размер базы до 200Гб

Answer 10 · 2013-04-14 17:40:52

Slader @Slader Автор вопроса

Может кто Berkley DB пользовался на SSD? Расскажите тогда, как оно?
Find и insert нужны. Delete — вообще нет

Ответ написан более трёх лет назад

Комментировать

Answer 11 · 2013-04-14 17:43:48

Может на PostgreSQL посмотрите, с другой стороны, особенно учитывая то, что у вас всего один сервер.

Есть такая презенташка — wiki.postgresql.org/images/b/b4/Pg-as-nosql-pgday-fosdem-2013.pdf. Конечно тесты решают, но всё же.

Лично мне MongoDB всегда казалась костыльным решением. Красивый API, достаточно возможностей. Но вот как доходит дело до эксплуатации, постоянно вылазит куча недоработок. Знакомые отзывались, что и админить геморрой.

Лучше уж Riak + Redis, когда много нод нужно, ну и соотвественно имеете все плюсы и минусы dynamo-style хранилища.

Answer 12 · 2013-04-14 20:25:01

sowich @sowich

Возможно orientDB покажет неплохой результат.

Ответ написан более трёх лет назад

Комментировать

Answer 13 · 2013-04-15 00:08:19

Пума Тайланд @opium

Просто люблю качественно работать

Может вам find делать через какой нибудь sphinxsearch?

Ответ написан более трёх лет назад

4 комментария

Answer 14 · 2013-04-15 00:52:49

не знаю точно, почему тормоза в монго, но в мускуле ваша задача решается через бд с движком archive. На такой системе он спокойно переварит вашу нагрузку и даже под десяток виртуалок памяти останется. Вы сильно промахнулись с платформой, пошли за модой, теперь расплачивайтесь :)

Answer 15 · 2013-05-15 10:33:42

Tenkoff @Tenkoff

LevelDB

Ответ написан более трёх лет назад

Комментировать

Answer 16 · 2014-04-08 22:53:05

Имхо у вас не верное архитектурное решение. Просто добавте реплику в ReadOnly и операции чтения - только с нее. И прощай write lock...

Answer 17 · 2014-05-14 08:37:36

Мне, кажется что вам нужно смотреть в сторону Riak (класс dynamodb и подобные).
Но, как правильно уже заметили выше, их преимущество можно почувствовать только при использовании в кластере, а использовать один instance -- это как стрелять из пушки по воробьям.
see more
Вот неплохой ответ как это можно все мигрировать, например на AWS DynamoDB
www.masonzhang.com/2013/07/lean7-migrate-from-mong...
news.dice.com/2013/02/21/why-my-team-went-with-dyn...
blog.cloudthat.in/5-reasons-why-dynamodb-is-better...

Answer 18 · 2014-08-15 16:01:04

Посмотрите на ElasticSearch, он хоть и позиционируется, в основном, как полнотектовый поисковик, прекрасно себя чуствует в роли NoSQL DB. Мы его уже так используем, очень довольны. Вот пример такого использования, хабра перевод. Особенно удобно то что для запросов в эластик используется JSON, после монго будет привычно (а еще и удобно)

На что сменить MongoDB

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт