Какую базу данных использовать для 93 млн строк (товары)?

Question

denis54 @denis54

Какую базу данных использовать для 93 млн строк (товары)?

Есть 93 млн строк (товары) 32 колонки
Какую базу данных использовать?
Что можно еще использовать в архитектуре для быстрого вывода, записи и перезаписи данных?

Возможно ваши советы.
Заранее благодарен...

Вопрос задан более трёх лет назад
2740 просмотров

2 комментария

Подписаться 12 Простой 2 комментария

Пригласить эксперта

Ответы на вопрос 7

Комментировать

1 комментарий

2 комментария

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Проектирование баз данных

Средний
Как хранить баланс пользователя в разных валютах?
- 1 подписчик
- вчера
- 96 просмотров
2

ответа
Проектирование баз данных

Средний
Можно ли создать базу данных на одной таблице?
- 2 подписчика
- 14 апр.
- 413 просмотров
3

ответа
Python

+4 ещё

Простой
Как проверить наличие id в строке файла .txt на python?
- 1 подписчик
- 11 апр.
- 88 просмотров
0

ответов
MySQL

+1 ещё

Средний
Какой подход к хранению данных выбрать?
- 1 подписчик
- 05 апр.
- 116 просмотров
1

ответ
Проектирование баз данных

Простой
Как лучше организовать структуру БД?
- 1 подписчик
- 30 мар.
- 106 просмотров
2

ответа
Веб-разработка

+1 ещё

Средний
Как реализовать синхронную регистрацию на сайте и форуме(XenFORO) мб(связать их бд)?
- 1 подписчик
- 24 мар.
- 71 просмотр
0

ответов
Проектирование баз данных

Простой
Обновление/Вставка в несколько таблиц данные одним запросом?
- 1 подписчик
- 21 мар.
- 81 просмотр
2

ответа
Проектирование баз данных

Средний
Как отобразить первичный ключ состоящий из вторичных?
- 2 подписчика
- 18 мар.
- 167 просмотров
1

ответ
PostgreSQL

+1 ещё

Средний
Как правильно написать sql запрос агрегации для фасетного фильтра?
- 2 подписчика
- 14 мар.
- 197 просмотров
0

ответов
Проектирование баз данных

Простой
Как хранить услуги в базе данных?
- 1 подписчик
- 11 мар.
- 108 просмотров
1

ответ
Показать ещё Загружается…

Разработчик баз данных PostgreSQL

Объединенные системы управления транспортом • Москва

До 220 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Программист C++ Builder / базы данных MySQL

RU Electronics • Москва

от 180 000 до 200 000 ₽

Реализовать редирект запросов в Chrome Extension Manifest v3

23 апр. 2024, в 21:14

1000 руб./за проект

Переместить сайт написанный на HTML, на python flask

23 апр. 2024, в 21:03

3000 руб./за проект

Написать программу под устройство с камерой, Python

23 апр. 2024, в 20:52

10000 руб./за проект

В ИТ все очень просто
Тут все четко, если быстро - то сразу указывается RPS
Я намекнул, что вы должны указать какой у вас RPS, железо и ресурсы

Answer 1 · 2018-04-11 16:07:14

93 млн. - сама по себе смешная нагрузка для современных СУБД на современных компьютерах.
Выбор СУБД зависит от того - а что именно вы собираетесь с этой базой данных делать.- в вопросе это не указано.

Ну например, если ваша цель быстро искать в это БД товары, а ваши 30 колонок - это фильтры, то отлично подходит СУБД для именно что полнотекстового поиска (пусть вас не смущает название, для фасеточного поиска она тоже подходит отлично). Это, к примеру:

если вы ориентированы на скорость SphinxSearch
если вам нужен кластер, то это ElasticSearch
если вам нужны традиционные инструменты типа SQL, - то это PostgreSQL, MySQL.

Если же задача другая - то идеальным выбором может быть и другая СУБД.
Нужны детали.

Думаю, дело в том, что вы увидели эти 90 млн. и решили, что нужно какое-то специфичное решение и не стали даже уточнять детали - а на деле, ничего такого в этих 90 млн. нет. А вот детали задачи - важны.

Рассмотрим задачу быстрой перезаписи - вы имели ввиду все 90 млн. перезаписывать целиком? Не частично. А вот это будет действительно проблемой. Мало какая из СУБД способна на быстрые изменения такого объема.

Ну и третий раз повангую - максимально быстрый доступ к данным - это если данные размещены в оперативной памяти. Один из наиболее развитых инструментов, с размещение в оперативной памяти и с функционалом СУБД - Tarantool. Быстрее, чем in-memory DB, к которым относится Tarantool - и вариантов нет.

Но понадобится соответствующее количество оперативки.

Если оперативки мало, то можно глянуть Aerospike. Это "почти in-memory DB". Но объемы данных могут быть огромны, при небольших запросах к оперативке. От оперативки требуется только целиком вмещать индексы, а не сами данные.

Короче, ванговать мне надоело.

У вас нет постановки задачи - ответить вам посему и нечего конкретного невозможно.

Answer 2 · 2018-04-11 11:07:07

Из бесплатных PostgreSQL, оптимизируйте индексацию, систему хранения СУБД и дисковую подсистему ну и памяти в сервер добавьте, если нужно.
Вообще вопрос абстрактный.
Если вас не устраивает существующий вариант, то нужно найти что именно привело к этому - возможно какая-то конкретная операция (или несколько) заставляет тормозить сервер, нужно их найти и разбираться с ними.
Если просто заменить СУБД, оставив приложение в том же виде, то на новой СУБД вы скорее всего словите те же проблемы, возможно не сразу, а через какое-то время.

Answer 3 · 2018-04-11 11:47:30

Слишком расплывчатое ТЗ. 93 млн в одной таблице? Колонки в таблице длинной 20 байт? Одна таблица в БД?
Вообщем наймите архитектора, что бы потом не мучится с низким быстродействием, внезапными блокировками и прочими прелестями ошибок в архитектуре.

Answer 4 · 2018-04-11 12:07:52

На мой взгляд, достаточно очевидно, что какую базу ни возьми, в одну таблицу все эти товары записывать бессмысленно - все операции с такой таблицей будут занимать продолжительное время.

Answer 5 · 2018-04-11 14:26:02

Ерлан Ибраев @mad_nazgul

Да какую угодно.
Можно вообще обойтись без БД.
Например каким-нибудь hadoop или kafka.
<:o)

Ответ написан более трёх лет назад

1 комментарий

Answer 6 · 2018-04-11 15:57:23

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Свой тип товара - своя таблица и приведение к ДНФ3. БД - любая.

Ответ написан более трёх лет назад

Комментировать

Answer 7 · 2018-04-11 19:48:01

Если количество колонок постоянное и таблица денормализована, то postgresql.
Если количество колонок меняется и таблица денормализована, то mongodb.
Вместо mongo можно использовать postgres jsonb, но синтаксис запросов там довольно специфичный. Postgres jsonb работает быстро как mongo.
Если таблица нормализована, то будет тормозить на слабом железе.

Какую базу данных использовать для 93 млн строк (товары)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт