Кластер из 10 Atom D2700 vs один i7-2600?

Question

Алексей Помогаев @Foror

Графоман

Кластер из 10 Atom D2700 vs один i7-2600?

Есть огромная БД на MongoDB, из-за большего количества записей время выборки данных не устраивает. Ясно, что нужно делать шардинг. Сейчас это работает на процессоре i7-2600, а шардинг планируется сделать на Atom D2700 (из-за стоимости).

Посмотрел вот такие тесты www.cpubenchmark.net/cpu.php?cpu=Intel+Atom+D2700+... разница в тестах (я пока не разбирался что это за тесты) примерно 12 раз.

Так будет смысл делать шардинг, чтобы получить существенный выигрыш при выборке записей, если заменить один i7 на 10 атомов?

Получается 40 ядер (с учетом HT) и ram 40 Гб, против 8 ядер (с учетом HT) и ram 32 Гб.

Да, выборки идут параллельно, и чем их больше будет параллельно, тем лучше для выигрыша в производительности. Но конечно и время одной выборки может значительно сократиться, если будет на Atom D2700 делаться… Т.е. 100 выборок на i7 без шардинга или делаем 100 выборок на Atom D2700 с шардингом. Что в итоге отработает быстрее и будет ли это в разы быстрее.

Вопрос задан более трёх лет назад
3791 просмотр

Комментировать

Подписаться 5 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 6

Комментировать

1 комментарий

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

MongoDB

Простой
Как упростить запрос к БД?
- 1 подписчик
- 12 апр.
- 82 просмотра
1

ответ
MongoDB

Простой
Как проверить данные перед записью в mongoDB?
- 1 подписчик
- 12 апр.
- 45 просмотров
1

ответ
MongoDB

Средний
Как сделать выборку из двух коллекций в MongoDB?
- 1 подписчик
- 10 апр.
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Ка решить проблему с тем, что MongoClient не может подключиться к MongoDB Altus?
- 2 подписчика
- 07 апр.
- 388 просмотров
1

ответ
Windows Server

+1 ещё

Простой
Что делать при ошибке A security package specific error occurred при проверки создании кластера?
- 1 подписчик
- 26 мар.
- 32 просмотра
0

ответов
Python

+1 ещё

Простой
Ошибка с pymongo?
- 1 подписчик
- 19 мар.
- 57 просмотров
0

ответов
Windows Server

+3 ещё

Простой
Какой тип raid наиболее лучше подходит для СХД в кластере Windows?
- 2 подписчика
- 13 мар.
- 392 просмотра
4

ответа
Кластеры

+1 ещё

Средний
Как запрашивать авторизацию пользователя при обращении к Intel MPI?
- 1 подписчик
- 11 мар.
- 39 просмотров
0

ответов
JavaScript

+3 ещё

Простой
Запуск компьютера с удаленным доступом и некоторыми службами. Как это провернуть максимально правильно?
- 2 подписчика
- 07 мар.
- 174 просмотра
1

ответ
Node.js

+1 ещё

Простой
Node.js mongodb почему не работает connectionClosed?
- 1 подписчик
- 04 мар.
- 83 просмотра
1

ответ
Показать ещё Загружается…

Backend Developer (Node.js), Remote 🔥

Fundraise Up

от 3 800 до 6 300 $

Senior Backend-разработчик (NestJS)

Эволюшн менеджмент

от 200 000 до 300 000 ₽

Опытный Golang-разработчик

Finandy

от 5 000 $

Настроить доступ к Netflix

20 апр. 2024, в 18:04

3000 руб./за проект

Помочь настроить GeoIp у nginx для docker nginx:alpine

20 апр. 2024, в 17:55

3000 руб./за проект

Карточная игра "сумасшедшие восьмёрки" на winforms

20 апр. 2024, в 17:49

1500 руб./за проект

Answer 1 · 2012-03-02 14:15:32

Я не с ответом, а с просьбой — если все же будете делать, напишите (лучше, конечно, пост) о результатах. Тема уж больно интересная, сам в раздумьях.

Answer 2 · 2012-03-02 11:54:36

Что в итоге отработает быстрее и будет ли это в разы быстрее.
На мой взгляд ни одна теоретическая выкладка не сможет для вашей индивидуальной задачи сказать, что лучше. Только запуск и тестирование покажет правду…

Answer 3 · 2012-03-03 00:09:25

А покажите ваш топ с сервера.
Не знаю чего люди странные советы дают без топа.
Не хватает именно проца? Сколько весят базы данных в монге?
На сервере монга одна или ещё что то крутить?

Answer 4 · 2012-03-02 14:28:26

Минусы атомов:
1. Оверхед на систему. На каждой из 10 машин с 4 ГБ памяти, скажем, 500 МБ будет скушано разными системными вещами. 3.5 ГБ памяти для монго даже с небольшой базой — маловато будет.
2. Оверхед на сеть. Хороший гигабитный контроллер прилично нагрузит слабый атом именно сетевой подсистемой.
3. Репликация и бэкапы. Еще 10 атомов? Реплицироваться с шарденой системы на один большой, но тупой сервер, вроде бы, нельзя пока что.
4. У 10 атомов в 10 раз больше шанс чему-то поломаться.
Можно и еще что-то придумать, наверное. Хотя 3 и 4 относятся к любой многосерверной конфигурации, и в реально больших системах с ними просто приходится мириться.

Чисто умозрительно можно посоветовать:
1. Поставить SSD в RAID1 по 250-500 ГБ и базу на них разместить. Читаться будет почти как из памяти.
2. Взять не 2600, а 3930K и добить до 64 ГБ памяти. Реплицировать куда-нибудь послабее.

Answer 5 · 2012-03-02 19:14:19

Проясните пожалуйста такой момент: в вопросе вы пишите, что не устраивает время выборки данных, а в комментариях пишите, что все индексы в памяти. Но ведь индекс — это всего-лишь «указатель», в каком блоке на ЖД хранится данные… и считывание всё-равно происходит с ЖД, а это 5-10 ms.

Не думали попробовать хранить данные на SSD? — скорость рандомного доступа ~0.1 ms, что может быть на 2 порядка быстрее ЖД.

Answer 6 · 2012-03-02 12:04:36

А БД лежит на одном диске или на нескольких? Т.е. я хочу сказать, что какая разница сколько будет у вас процессоров, если пропускная способность к БД не измениться. Соответственно производительность будет упираться лишь ширину канала до БД.

Кластер из 10 Atom D2700 vs один i7-2600?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт