Postgresql не обрабатывает запросы. Почему?

Question

VMCLOUD @VMCLOUD

PostgreSQL

Postgresql не обрабатывает запросы. Почему?

Собственно, коллеги, ситуация следующая.

Имеется PGSQL 9.2, на сервере 2 * Xeon 2620 CPU \ 128 Gb Ram \ 8 * 600Gb SAS (Raid 10). Канал 1Gbps.

Размер базы около 200 Gb с индексами. Конфиг базы pastebin.com/RN6CKXPP На фронтендах стоят pgbouncer-ы, фронтенды обрабатывают до 1к запросов в минуту.

Раз в сутки база начинает намертво виснуть (не выполнять запросы), или тупить на очень простых запросах (раньше например простой select выполнялся 1 секунду, теперь 30-90). На практике такое впервые, поэтому и не знаю куда копать.

Прошу помощи! Если необходимо предоставлю более подробные данные .

Вопрос задан более трёх лет назад
3293 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

3 комментария

vyegorov @vyegorov

`checkpoint_segments` уменьшать не стоит, кроме занимаемого места и увеличения периода между чекпойнтами они не оказывают влияния на работу базы.

Написано более трёх лет назад
Timosha @Timosha

@vyegorov не соглашусь. "At checkpoint time, all dirty data pages are flushed to disk and a special checkpoint record is written to the log file." Таким образом одномоментно база пытается записать checkpoint_segments * checkpoint_completion_target * 16MB данных на винчестер. в данном случае это около 15GB.

Написано более трёх лет назад
vyegorov @vyegorov

@Timosha, тут дело в архитектуре. Все таблицы поделены на страницы (pages), это сделано для удобства администрирования. Соответственно, кэш базы (shared_buffers) состоит из этих страниц. Каждое изменение в данных должно быть записано на диск (WAL, последовательная запись), но синхронизация страниц откладывается, т.к. тут запись произвольная. Так вот checkpoint_segments — это то, куда пишется WAL. И он не может быть связан с чекпоинтом, т.к. чекпоинт подразумевает запись измененных страниц (грязных) в их места в файлах таблиц. И кол-во сегментов влияет только на время до следующего чекпоинта, т.е. если их мало, то база будет часто делать чекпоинты и жаловаться. Попробуйте поставить сегменты=3 и дать хорошую нагрузку.

Кстати, максимальный объем записываем данных не может быть больше размера shared_buffers, т.к. смысл чекпоинта в сохранении на диск грязных данных из кэша.

Рекомендую эти слайды для понимания, увы, на английском, хотя и в картинках.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

Простой
Нужен ли первичный ключ в таблицах PostgreSQL?
- 1 подписчик
- час назад
- 52 просмотра
1

ответ
PostgreSQL

+1 ещё

Простой
Как добавить отношения «многие-ко-многим» между таблицами из разных баз данных?
- 1 подписчик
- 21 час назад
- 111 просмотров
4

ответа
PostgreSQL

+1 ещё

Простой
Как исправить неправильное отображение данных в csv после экспорта?
- 1 подписчик
- 17 апр.
- 102 просмотра
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 192 просмотра
3

ответа
PostgreSQL

+2 ещё

Простой
Где искать рекомендуемые настройки SSL-аутентификации для Docker-образа Posgres?
- 1 подписчик
- 17 апр.
- 62 просмотра
3

ответа
PostgreSQL

+1 ещё

Простой
Как поправить язык в SQL Shell (psql)?
- 1 подписчик
- 14 апр.
- 95 просмотров
1

ответ
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 142 просмотра
2

ответа
PostgreSQL

Простой
Как взять значение из одной таблицы и прибавить к значению другой таблицы?
- 1 подписчик
- 12 апр.
- 80 просмотров
1

ответ
PostgreSQL

Простой
Psq восстановление бэкапа, что делаю не так?
- 1 подписчик
- 11 апр.
- 83 просмотра
2

ответа
PostgreSQL

+1 ещё

Средний
С чем может быть связана высокая нагрузка на сервер Postgres?
- 2 подписчика
- 11 апр.
- 193 просмотра
1

ответ
Показать ещё Загружается…

Администратор PostgreSQL

Гринатом

До 200 000 ₽

Разработчик баз данных PostgreSQL

Объединенные системы управления транспортом • Москва

До 220 000 ₽

DBA / Администратор баз данных PostgreSQL

СберТех • Москва

от 320 000 ₽

Необходимо отверстать страницу сайта с мобильной версией и адаптивным

23 апр. 2024, в 17:59

1000 руб./в час

Разместить объявления на Авито

23 апр. 2024, в 17:47

10000 руб./за проект

Осуществлять оптовые продажи товаров для дома

23 апр. 2024, в 17:43

30000 руб./за проект

Answer 1 · 2014-08-03 10:50:50

если в момент "зависания" количество запросов не изменятся, то есть их внезапно не становится в 10 раз больше. смотрите где именно затык, I/O, CPU? Какие запросы волполняются в этот момент, сколько памяти потребляют процессы, сколько активных процессов postgresql в этот момент? Что происходит с дисками? запись/чтение?
Судя по конфигу, при незначительном объёме изменений может происходить запись checkpoint. Уменьшите checkpoint_segments = 1024 раз в 10
work_mem = 768MB тоже слишком много. 10МБ более чем достаточно для большинства задач
а default_statistics_target = 50 наоборот мало, учитывая дефолтное значение - 100, поставьте 200-300.
Не понятен мотив подкрутки параметров планировщика, зачем?

Answer 2 · 2014-08-08 11:28:24

Не хватает информации, но попробую.

В чем может быть проблема?
Имеем:

128Гб всего;
50Гб отдано под кэш, т.е. системе эта память недоступна.

Итого 78Гб используемой памяти.

База может исполнять до 500 (max_connections) запросов параллельно. Каждый из них может использовать как минимум 768Мб (work_mem) для операций сортировки/группировки/хэширования. “Как минимум” потому, что если запрос требует нескольких таких операций, то 768Мб съест каждая из них.

Если предположить, что запросы простые и используют не более одной подобной операции, то при доступной памяти (78Гб) можно себе позволить 104 таких запроса. Т.е. параметр `max_connections` должен быть равен (78*1024/768) = 104, или система уйдет в своппинг при такой нагрузке.

Если установленное кол-во возможных сессий необходимо, то память нужно уменьшить до (78*1024/500) = 160, это если не будет сложных запросов.

Мне кажется, что в те моменты, когда база “стоит на коленях” как раз и происходит такая ситуация, когда выделенные ей ресурсы превосходят физически доступные и ядро уходит в своп. Это если исключить возможность любых других процессов в системе — мало-ли, запускается ручной VACUUM в такие моменты...

А как проверить, что же происходит на самом деле?
Мониторить. Прежде всего ось. Либо готовыми системами (zabbix и nagios самые распространенные в моей практике), либо использовать `vmstat` или `dstat` (я их использую в 95% случаев). Это позволит “увидеть” что происходит в системе, как работает память и подсистема ввода-вывода, своппинг.

Выжать больше информации из самой базы. Как минимум я всегда включаю следующие опции:

log_min_duration_statement = 300
log_checkpoints = on
log_connections = on
log_disconnections = on
log_lock_waits = on
log_temp_files = 0
track_functions = pl
track_io_timing = on
log_autovacuum_min_duration = 5000

Да — в логах будет гораздо больше информации, но так удобнее. Если известна конкретная база с проблемами (из многих), то избыточное логгирование можно включить только для нее через `ALTER DATABASE ... SET ...`. Тоже самое применимо и для конкретных пользователей. Однако я предпочитаю полное логгирование на уровне всего кластера.

Также рекомендую просматривать (и, возможно, сохранять снимки) статистических таблиц, как минимум `pg_stat_activity` и `pg_locks`.

Что можно сделать сразу?
Все нижесказанное мое мнение, я очень рекомендую изменять настройки обдуманно и, желательно, проверять новую конфигурацию через нагрузочные тесты.

`shared_buffers` уменьшить, до 8Гб (на крайний случай 16). Чем больше размер, тем больше расходы базы на обслуживание кэша. PostgreSQL страдает от избыточной конкуренции за доступ к кэшу при его больших размерах. Сравнительно небольшой кэш при большом объеме памяти будет вести себя хорошо, т.к. ОС тоже кэширует файлы и доступ к блокам будет быстрым (медленнее, чем сразу из shared_buffers, но быстрее, чем при холодном старте системы);
`default_statistics_target` увеличить. Понижать этот параметр я в принципе не вижу смысла. Учитывая размер базы в 200Гб предположу, что есть несколько таблиц в сумме занимающих более 50% это объема. Потому увеличил бы этот параметр до 200 для всей системы, и для индивидуальных колонок в больших таблицах еще выше, но это уже при настройке индивидуальных запросов. Главное после изменений проанализировать базу;
`max_connections` нужно уменьшить. Я бы оставил этот параметр на уровне 150-200 сессий. Также непонятно наличие нескольких pgbouncer-ов. Нужно оставить только один и, если необходимо, настроить в нем несколько пулов. Эффект будет лучший при меньших накладных расходах;
`work_mem` нужно уменьшить. Я бы его установил в 32Мб, это уже очень хорошо. Данный параметр меняется на уровне сессий, потому обычной практикой для больших скриптов/отчетов является его выкручивание под нужды конкретного отчета. Скажем, у меня есть отчет, где первым делом этот параметр устанавливается в 900Мб под нужды этого отчета, значение получено через `EXPLAIN ANALYZE`. Как вариант, можно завести пользователя (или нескольких) для отчетов (или тяжелых запросов) и им в настройках прописать более высокое значение `work_mem`.

В заключении — я думаю вам нужно изменить параметры базы и получить больше информации о том, что происходит. После этого можно будет говорить о ситуации дальше.

Postgresql не обрабатывает запросы. Почему?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт