Нужно ли прорабатывать масштабирование / шардинг при использовании облачных БД?

Question

Ярослав @xenon

Too drunk to fsck

Нужно ли прорабатывать масштабирование / шардинг при использовании облачных БД?

Есть собственное веб-приложение, которое (в нынешнем варианте) хранит данные в MySQL на том же сервере. Отлично работает в масштабе одного сервера при текущей (довольно невысокой) нагрузке, но возникает интерес, как оно будет работать, если вдруг внезапно на нем окажется в тысячу раз больше пользователей (и все таблицы в базе станут гораздо больше, каждый запрос будет более трудоемким да и сумма запросов на базу вырастет) ?

В принципе, каждый пользователь работает со своими данными, и взаимодействие между пользователями очень небольшое (для упрощения вопроса - будем считать, что его вообще нет). Поэтому сейчас рабочая идея - использовать горизонтальный шардинг, на каждом сервере держать столько пользователей, сколько он вытягивает (и все масштабирование состоит в том, чтобы при логине юзера перекинуть его на правильный сервер).

Если перейти, например, на AWS RDS (или посоветуете какие-то другие варианты?), придется ли как-то использовать похожие схемы (отдельные базы данных/шарды для каждой группы пользователей) или можно тупо не волноваться о нагрузке, она любую разумную нагрузку вытянет? (А суммы, которые придется за это платить, будут больше, чем если переобдумать схему масштабирования)?

Вообще, есть какие-то может быть хорошие гайды по легкому масштабированию для моего случая (когда каждый юзер работает исключительно со своими данными). В каждой таблице (коих немало) иметь поле user_id и по нему индексировать, и в каждом запросе указывать WHERE user_id=NNN ? Но это кажется довольно трудоемким и много шансов где-то в коде пропустить это условие. Напрашивается простое решение, чтоб у каждого юзера все его данные были в его базе данных (очень небольшой) и приложение работало с ней. Но тогда у нас будет очень много баз данных, и это будет немного некрасиво как-то. Может быть как-то можно получить аналогичный эффект сохранив простоту и надежность и малый риск ошибок?

Вопрос задан более трёх лет назад
146 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Решения вопроса 1

6 комментариев

Пригласить эксперта

Ответы на вопрос 1

5 комментариев

Ярослав @xenon Автор вопроса

В целом, я с вами согласен, это все разумно. Но вот в моем случае, похоже, не подойдет:

1. Stress тест
Приложение сейчас хостится на VPSках. Соответственно, тут две стороны - с одной, на дешевой VPS в предел производительности мы точно можем упереться довольно легко. С другой - всегда есть решение в виде простого апгрейда тарифа на более мощную VPS. (Но мне, технически, конечно хотелось бы заранее знать, что архитектура у меня такая, что масштабироваться будет легко, даже когда дальше уже некуда апгрейдиться). А вот stress-тест сделать на облачной базе - можно ли? Или выйдет достаточно дорого (ведь нужно ее забить огромными объемами) ?

2. Read Only запросы
Увы, приложение по большей части собирает данные. Конечно, иногда и отдает тоже, но в обычном случае, наверное, на 100-1000 read есть один write, а у меня наоборот.

Хотя кто потом будет читать этот вопрос, для них это, возможно, будет правильными советами, сам так считаю.

Написано более трёх лет назад
Vitaly Karasik @vitaly_il1

Ярослав Поляков, без нагрузочного тестирования и тестов и мониторинга в принципе нельзя принять правильные решения насчет архитектуры. Ну или почти нельзя.
К счастью, в облаках сегодня поминутная или даже посекундная тарификация, так что все можно проверить очень недорого.

А вот stress-тест сделать на облачной базе - можно ли

Можно использовать или облачные сервисы loadimpact.com и т.д., или запускать свои скрипты для нагрузки на обычных линуксах ( locust.io и т.п.)

архитектура у меня такая, что масштабироваться будет легко, даже когда дальше уже некуда апгрейдиться

При какой-то нагрузке мы действительно упремся в возможности одно сервера базы данных для записи.
С реляционными базами масштабировать запись можно, но не очень легко.
С другой стороны, есть полезный совет "сначала запусти систему, а потом ломай голову что делать когда ты будешь Гуглом".

Написано более трёх лет назад
Иван Шумов @inoise Куратор тега Amazon Web Services

Vitaly Karasik, правильное решение принять можно, конечно. Просто такая архитектура будет СТОИТЬ.

Написано более трёх лет назад
Vitaly Karasik @vitaly_il1

Иван Шумов,
правильное решение принять можно, конечно. Просто такая архитектура будет СТОИТЬ.

Решение стоимостью $1M для моей домашней странички с посещаемостью 100 человек в месяц будет неправильным.

Написано более трёх лет назад
Иван Шумов @inoise Куратор тега Amazon Web Services

Vitaly Karasik, Это зависит от бюджетов) люди часто путают слова правильная и подходящая. Правильная это когда она обеспечивает соответствие техническим требованиям, а подходящая - когда ещё и бизнес

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

MariaDB

Простой
Как динамически делать выборку по дням, неделям или месяцам?
- 1 подписчик
- вчера
- 25 просмотров
1

ответ
WordPress

+1 ещё

Простой
Wordpress на AWS?
- 1 подписчик
- вчера
- 42 просмотра
0

ответов
ASP.NET

+2 ещё

Сложный
Как отправить html шаблон с svg на gmail через aws?
- 5 подписчиков
- 11 апр.
- 3068 просмотров
1

ответ
Amazon Web Services

Простой
Elastic IP должен быть бесплатен или нет?
- 1 подписчик
- 29 мар.
- 69 просмотров
2

ответа
MariaDB

Простой
Как сделать выборку с определенного id до смещения?
- 1 подписчик
- 23 мар.
- 58 просмотров
0

ответов
PHP

+2 ещё

Простой
Кодировка и соединение БД битрикс в utf8mb4?
- 1 подписчик
- 17 мар.
- 150 просмотров
0

ответов
C#

+2 ещё

Простой
Как решить ошибку пула соединений к PostgreSql?
- 2 подписчика
- 15 февр.
- 235 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Не правильно возвращает объект в AWS, как исправить?
- 1 подписчик
- 11 февр.
- 45 просмотров
0

ответов
MariaDB

Средний
Почему не получаются значения NEW в триггере BEFORE UPDATE?
- 1 подписчик
- 04 февр.
- 86 просмотров
1

ответ
Linux

+3 ещё

Средний
Не могу зайти в панель управления FreePBX. Can't connect to local MySQL server through socket. Куда копать?
- 1 подписчик
- 04 февр.
- 161 просмотр
0

ответов
Показать ещё Загружается…

DevOps-инженер

Giftery.ru

от 200 000 до 250 000 ₽

Python/Django-разработчик (mobile+AI)

4Taps AI • Тольятти

от 150 000 до 250 000 ₽

GO/PHP-разработчик

Binom Lab • Санкт-Петербург

До 4 000 $

Переделать схему Фиат-Шамира

16 апр. 2024, в 23:34

200 руб./за проект

Установить Windows на Dedicated Server

16 апр. 2024, в 22:49

2500 руб./за проект

YOLO для распознания количества человек в очереди на кассу по видео ряду

16 апр. 2024, в 22:48

5000 руб./за проект

Answer 1 · 2019-11-03 23:12:15

Буду довольно резким, но зато без воды:
- облачные провайдеры не умеют в магию, только в создание ресурсов
- реляционные базы даже сегодня умеют только в вертикальное масштабирование
- да, думать приходится самостоятельно
- для облегчения жизни можно использовать Read Replicas, но готовьтесь к задержкам
- спайковую нагрузку реляционные базы выдерживать не умеют (да и остальные делают это из рук вон плохо)

Рекомендации:
- планируйте масштабирование
- научитесь понимать как используются ваши данные
- научитесь в микросервисы (и не по тому что это популярно, а по тому что так происходит изоляция данных)
- научитесь в другие виды баз данных, например то же DynamoDB, хотя если не вникать то можно огрести еще больше проблем
- вспомните что есть кэширование
- прочитайте что есть такие паттерны как CQRS
- научитесь в проектирование PWA (Progressive Web Applications)
- выбросите это все по тому что это будет очень дорого по итогу

Answer 2 · 2019-11-04 08:09:33

Отлично работает в масштабе одного сервера при текущей (довольно невысокой) нагрузке, но возникает интерес, как оно будет работать, если вдруг внезапно на нем окажется в тысячу раз больше пользователей

Ответ очень простой - проверить с помощью stress test. То есть проанализировать текущий запросы к базе и симулировать х1000 кол-во пользователей. 90% что можно обойтись без шардинга, но опят покажет.
Плюс - с самого начала пишите аппликацию так, чтобы read-only запросы можно было направлять на отдельный ДБ сервер, это уменьшит нагрузку на master.

Нужно ли прорабатывать масштабирование / шардинг при использовании облачных БД?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт