Как заставить Postgres использовать индексы?

Question

Roman K @deliro

Как заставить Postgres использовать индексы?

Всем привет. Имеется вот такая таблица:

CREATE TABLE public.core_entry (
  id INTEGER PRIMARY KEY NOT NULL DEFAULT nextval('core_entry_id_seq'::regclass),
  keyword CHARACTER VARYING(100) NOT NULL,
  created TIMESTAMP WITH TIME ZONE NOT NULL
);
CREATE INDEX core_entry_e2fa5388 ON core_entry USING BTREE (created);
CREATE INDEX keyword_gist_idx ON core_entry USING GIST (keyword);

GiST индекс работает очень хорошо, но проблема в том, что он не работает на EXACT, т.е. при запросе

SELECT keyword FROM core_entry WHERE keyword='something';

Происходит Seq Scan
Да, это можно подстроить, написав

SELECT keyword FROM core_entry WHERE keyword LIKE 'something';

И результат будет такой же, но с применением индекса.

Главный (самый частый) же запрос выглядит вот так:

SELECT keyword, count(keyword) as count FROM core_entry WHERE keyword LIKE '%something%' GROUP BY keyword;

В этом случае функция count() начинает Seq Scan (судя по всему, проверяя равенство).
Тут я попробовал добавить обычный индекс:

CREATE INDEX keyword_idx ON core_entry USING BTREE (keyword);

И... Всё стало ещё хуже. Теперь он спокойно справляется с запросом

SELECT keyword FROM core_entry WHERE keyword='something';

Но LIKE '%something%' он обрабатывает последовательным чтением.

Вопрос:
Как изменить запрос (желательно удалив BTREE индекс, ибо в базу попадает 10млн записей в неделю), чтобы count(keyword) считался через GiST индекс?

Вопрос задан более трёх лет назад
2796 просмотров

3 комментария

Подписаться 3 Оценить 3 комментария

Артём Клименко @aklim007

>SELECT keyword, count(keyword) as count FROM core_entry WHERE keyword LIKE '%something%';
как понимаю тут group by пропущен?
а какая еврсия постгре у вас? Поскольку мне при всём желании не удалось аналогичном запросе сделать(postgre9.4) так чтоб индекс не использовался.
И на всякий случай analize у вас по этой табличке давно происходил?

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Артём Клименко: Да, забыл написать group by keyword. Версия 9.3. Индекс при поиске ключей используется, а при их подсчёте - нет.

Написано более трёх лет назад
Roman K @deliro Автор вопроса
Артём Клименко: Вот EXPLAIN запроса
SELECT keyword, count(keyword) as count FROM core_entry WHERE keyword LIKE '%вк%' GROUP BY keyword ORDER BY count DESC LIMIT 10;
Написано более трёх лет назад

Решения вопроса 1

11 комментариев

Roman K @deliro Автор вопроса

Вариант. Но мне важна скорость инсерта, а проверять каждый раз на существование keyword'а в таблице, кажется, будет затратно (даже если ловить эксепшн)

Написано более трёх лет назад
Кирилл @kshvakov

Roman Kitaev: не затратно будет, там uniq индекс

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Кирилл: А как тогда быстрее будет навскидку: проверка на существование и создание или просто создавать и пропускать эксепшн?

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Кирилл: И, кстати, так я не смогу вставить в таблицу сразу, допустим, тысячу ключей. Только по одному.

Написано более трёх лет назад
Кирилл @kshvakov

Roman Kitaev: можно и тысячу сразу вставить в постгресе есть array ;)

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Кирилл: Я имею ввиду, что будет unique_violation

Написано более трёх лет назад
Кирилл @kshvakov

Roman Kitaev: в качестве намёка:

truncate core_keywords;

insert into core_keywords ( keyword)
select k from (select distinct unnest('{a,b,c,d,a,b,c,d}'::varchar[]) as k) _
where not exists (select 1 from core_keywords as k2 where k2.keyword = k);

insert into core_keywords_entry (keyword_id)
select
k.keyword_id
from core_keywords as k
join (select unnest('{a,b,c,d,a,b,c,d}'::varchar[]) as kw) as k2 on k.keyword = k2.kw;

;)

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Кирилл: Спасибо. Я с чистым SQL и особенностями постгреса столкнулся неделю назад. Ещё слишком ноль в этом :)

Написано более трёх лет назад
Кирилл @kshvakov

Roman Kitaev: "подтягивайте" его (sql), сильно поможет ;)

Написано более трёх лет назад
Roman K @deliro Автор вопроса

Кирилл: Да я уж заметил. Когда переписал три запроса (которые выполнялись за 20 секунд) в одну функцию, которая выполняется 0.2 секунды.

Написано более трёх лет назад
Кирилл @kshvakov

Roman Kitaev: это правильно, чем ближе к СУБД тем надежнее и производительнее, чем в приложении +100500 запросов туда-сюда гонять

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

PostgreSQL

Простой
Нужен ли первичный ключ в таблицах PostgreSQL?
- 1 подписчик
- 7 часов назад
- 68 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как добавить отношения «многие-ко-многим» между таблицами из разных баз данных?
- 1 подписчик
- вчера
- 114 просмотров
4

ответа
MySQL

+1 ещё

Простой
Как извлечь топ 15 очков из таблицы чтобы игроки не дублировались?
- 1 подписчик
- вчера
- 96 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как исправить неправильное отображение данных в csv после экспорта?
- 1 подписчик
- 17 апр.
- 102 просмотра
1

ответ
Java

+3 ещё

Средний
Пытаюсь подключиться к postgresql 16 через docker-compose, использую spring-boot 3.2.4, что не так?
- 1 подписчик
- 17 апр.
- 193 просмотра
3

ответа
PostgreSQL

+2 ещё

Простой
Где искать рекомендуемые настройки SSL-аутентификации для Docker-образа Posgres?
- 1 подписчик
- 17 апр.
- 62 просмотра
3

ответа
PostgreSQL

+1 ещё

Простой
Как поправить язык в SQL Shell (psql)?
- 1 подписчик
- 14 апр.
- 96 просмотров
1

ответ
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 142 просмотра
2

ответа
PostgreSQL

Простой
Как взять значение из одной таблицы и прибавить к значению другой таблицы?
- 1 подписчик
- 12 апр.
- 81 просмотр
1

ответ
PostgreSQL

Простой
Psq восстановление бэкапа, что делаю не так?
- 1 подписчик
- 11 апр.
- 83 просмотра
2

ответа
Показать ещё Загружается…

Тестировщик SQL

Bell Integrator • Санкт-Петербург

До 200 000 ₽

Программист SQL

АвтоАльянс • Москва

от 165 000 ₽

Программист SQL

САМО-Софт • Москва

До 220 000 ₽

Разработка дизайна раздела «Статьи» на сайте «Мир отходов»

23 апр. 2024, в 23:01

10000 руб./за проект

Дизайн личного кабинета (клиентская часть)

23 апр. 2024, в 22:37

500 руб./в час

Скрипт для Solana быстрый

23 апр. 2024, в 22:33

25000 руб./за проект

>SELECT keyword, count(keyword) as count FROM core_entry WHERE keyword LIKE '%something%';
как понимаю тут group by пропущен?
а какая еврсия постгре у вас? Поскольку мне при всём желании не удалось аналогичном запросе сделать(postgre9.4) так чтоб индекс не использовался.
И на всякий случай analize у вас по этой табличке давно происходил?
Артём Клименко: Да, забыл написать group by keyword. Версия 9.3. Индекс при поиске ключей используется, а при их подсчёте - нет.
Артём Клименко: Вот EXPLAIN запроса
SELECT keyword, count(keyword) as count FROM core_entry WHERE keyword LIKE '%вк%' GROUP BY keyword ORDER BY count DESC LIMIT 10;

Answer 1 · 2015-12-10 18:43:26

Сделайте 2 таблицы, что то вроде

create table core_keywords(
    keyword_id serial primary key,
    keyword    varchar(100)
);
create unique index u_idx_keyword on core_keywords(lower(keyword));
create index t_idx_keywords on core_keywords using gin (lower(keyword) gin_trgm_ops);

create table core_keywords_entry(
    keyword_id int not null references core_keywords,
    created_at timestamp with time zone not null default CURRENT_TIMESTAMP,
    primary key (keyword_id, created_at)
);

ну и будет все проще, что-то вроде

select 
    e.keyword_id, 
    count(*) 
from core_keywords_entry as e
join core_keywords as k using(keyword_id)
where lower(k.keyword) like  '%something%'
group by 1

Answer 2 · 2015-12-10 22:52:31

А что если keyword сделать массивом (или использовать tsvector), тогда должен работать поиск на точные совпадения, а значит (возможно) и заработает группировка. В монге так "облако тегов" работает нормально.

Как заставить Postgres использовать индексы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт