Почему Postgresql такой медленный?

Question

Анатолий Сидоров @sidan

php-developer

Почему Postgresql такой медленный?

Добрый день!
В интернете множество хвалебных отзывов о постгресе, у всех все хорошо и здорово, таблицы с миллиардами данных и пр.
В действительности же мы на данный момент имеем таблицу на 1.5 миллиона записей статистики, обычный запрос на count(*) выполняется 0.700 мс.

[SQL] EXPLAIN ANALYSE select count(*) from table

Aggregate  (cost=174099.68..174099.69 rows=1 width=8) (actual time=787.417..787.418 rows=1 loops=1)
  ->  Seq Scan on table (cost=0.00..170511.54 rows=1435254 width=0) (actual time=0.444..637.771 rows=1435107 loops=1)
Planning time: 0.110 ms
Execution time: 787.479 ms

[SQL] EXPLAIN ANALYSE select count(*) from table where user_id=114
Aggregate  (cost=166624.17..166624.18 rows=1 width=8) (actual time=482.791..482.792 rows=1 loops=1)
  ->  Bitmap Heap Scan on table (cost=2919.96..166234.64 rows=155811 width=0) (actual time=46.828..463.465 rows=156944 loops=1)
        Recheck Cond: (user_id = 114)
        Rows Removed by Index Recheck: 153189
        Heap Blocks: exact=39222 lossy=26507
        ->  Bitmap Index Scan on idx_user_id  (cost=0.00..2881.01 rows=155811 width=0) (actual time=36.766..36.766 rows=156944 loops=1)
              Index Cond: (user_id = 114)
Planning time: 0.242 ms
Execution time: 483.520 ms

И это ведь простой подсчет кол-ва, а ведь требуется еще и агрегация отдельных столбцов, и джоины, и дистинкты, и еще много много чего.
Что мы упускаем? Нам просто нужно уметь быстро отфильтровать большой объем данных по заданной дате и пользователю. Партиционирование только усугубляет ситуацию, вероятно слишком малый объем данных.

UPD. Самый простой пример. Если миллион записей формата UUID, user_id, date. 95% запросов на select - это фильтр по user_id + date between(start, end). Что поможет в этом случае? Сейчас стоит btree-индекс на dt + user_id.

Заранее спасибо.

Вопрос задан более трёх лет назад
3373 просмотра

1 комментарий

Подписаться 11 Оценить 1 комментарий

Пригласить эксперта

Ответы на вопрос 6

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

+1 ещё

Простой
Как исправить неправильное отображение данных в csv после экспорта?
- 1 подписчик
- 17 апр.
- 90 просмотров
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 158 просмотров
3

ответа
PostgreSQL

+2 ещё

Простой
Где искать рекомендуемые настройки SSL-аутентификации для Docker-образа Posgres?
- 1 подписчик
- 17 апр.
- 59 просмотров
3

ответа
PostgreSQL

+1 ещё

Простой
Как поправить язык в SQL Shell (psql)?
- 1 подписчик
- 14 апр.
- 91 просмотр
1

ответ
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 134 просмотра
2

ответа
PostgreSQL

Простой
Как взять значение из одной таблицы и прибавить к значению другой таблицы?
- 1 подписчик
- 12 апр.
- 79 просмотров
1

ответ
PostgreSQL

Простой
Psq восстановление бэкапа, что делаю не так?
- 1 подписчик
- 11 апр.
- 81 просмотр
2

ответа
PostgreSQL

+1 ещё

Средний
С чем может быть связана высокая нагрузка на сервер Postgres?
- 2 подписчика
- 11 апр.
- 186 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему большой iowait в cloud vm c postgres?
- 5 подписчиков
- 11 апр.
- 2092 просмотра
4

ответа
Python

+3 ещё

Простой
Как и где захостить телеграм бота с БД на PostgreSQL?
- 1 подписчик
- 10 апр.
- 126 просмотров
1

ответ
Показать ещё Загружается…

Тестировщик SQL

Bell Integrator • Санкт-Петербург

До 200 000 ₽

Программист SQL

САМО-Софт • Москва

До 220 000 ₽

Разработчик БД SQL

FS Travel • Москва

от 170 000 ₽

Разработка VST-плагина

19 апр. 2024, в 20:43

20000 руб./за проект

Нарисовать баннер для интернет-магазина

19 апр. 2024, в 20:35

500 руб./в час

Разработать несистемный алерт

19 апр. 2024, в 20:11

500 руб./за проект

Если вы хотите, чтобы быстро работало, используйте MariaDB или MongoDB, если задача позволяет.
Postgre подойдет для сложной аналитики и сложной БД, хранимок и т.д.

Answer 1 · 2017-04-25 12:45:33

По поводу медленного COUNT на всю таблицу вам написали, а вот второй запрос "по нормальному" должен отрабатывать мгновенно, при условии что постгрес правильно настроен.

Вы случайно не используете настройки по умолчанию (а они там такие чтоб работало даже на калькуляторе)?
есди да то советую postgresql.leopard.in.ua там какраз новая версия недавно вышла.

Answer 2 · 2017-04-25 12:38:00

Александр Аксентьев @Sanasol

нельзя просто так взять и загуглить ошибку

https://wiki.postgresql.org/wiki/Slow_Counting

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2017-04-25 16:45:44

Recheck Cond: (user_id = 114)
Rows Removed by Index Recheck: 153189
Heap Blocks: exact=39222 lossy=26507

У вас делается повторная проверка этого самого условия и она действительно отфильтровывает значительное количество строк. Long story short - вам не хватает work_mem, повысьте.

Answer 4 · 2017-04-27 16:08:13

Первый запрос не использует индекс. Похоже, что у таблицы нет PRIMARY KEY.
Второй запрос тоже не понятный. Похоже, что user_id содержится в комплексном индексе, типа (user_type, user_id), и т.к. не задействуется первое поле в запросе, то запрос тормозит.

Нужен DDL таблицы - без него это все напоминает гадание на кофейной гуще.

Answer 5 · 2017-05-04 12:17:44

Андрей Шишкин @compilator

Senior Data Engineer

"Почему Postgresql такой медленный?"

Вы просто не умеете его готовить.

Ответ написан более трёх лет назад

Комментировать

Answer 6 · 2017-04-25 17:06:58

Макс @MaxDukov

впишусь в проект как SRE/DevOps.

а сделайте ка EXPLAIN (ANALYSE, BUFFERS) ...

Ответ написан более трёх лет назад

Комментировать

Почему Postgresql такой медленный?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт