Как организовать автокомплит адреса в Elasticsearch?

Question

ordinary_pavel @ordinary_pavel

Как организовать автокомплит адреса в Elasticsearch?

Доброго времени суток! Возникла необходимость в написании автокомплита адресов. Для этого решили брать адреса из БД ФИАСа и индексировать в еластике в виде строки адреса типа "Магаданская область, г. Магадан, ул Пролетарская, д. 117".
По этой строке я делаю полнотекстовый поиск.
Анализатор кастомный. Настройки следующие:
https://gist.github.com/anonymous/dc84e31ff7f40ea3...

Для запросов использую match_phrase_prefix:
'match_phrase_prefix': {
"plaintext": {
"query": "ленина 7",
"analyzer": "address"
}

}

Ищет более-менее вменяемо. Однако, есть две проблемы.
1) как бы мне не учитывать порядок слов, по которым происходит поиск в фразе? Есть ли варианты кроме slop?
2) При поиске по префиксам когда делаешь запрос вида: "Ленина 1" результаты "Ленина д. 1", "Ленина д. 12", "Ленина д. 113" и т.п. имеют одинковый score в выдаче (предполагаю, что еластик побайтово анализирует строку при поиске по префиксу и как только находит совпадение по некоторому токену включает результат в выдачу независимо от того, то идет за совпадением). Соответственно, возникает неприятная ситуация, когда по запросу "Ленина 1" первый дом получить невозможно (при ограничении числа результатов 10), т.к. выдачу засоряют дома вроде "Ленина д. 112", "Ленина д. 113").
Как бы мне дать бонус для точного совпадения?

Пробовал также suggest поле, но искало не очень хорошо, в виду того что по inputу нельзя сделать нормальный query
Ну и вообще возможно идея организации автокомплита полнотекствым поиском не лучшая. Есть ли у кого то идеи как правильно делать автокомплит адреса?

Вопрос задан более трёх лет назад
1413 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

MySQL

+1 ещё

Простой
Как извлечь топ 15 очков из таблицы чтобы игроки не дублировались?
- 1 подписчик
- 23 часа назад
- 94 просмотра
1

ответ
Docker

+1 ещё

Простой
Почему эластику стало не хватать место в докере?
- 4 подписчика
- 21 апр.
- 2083 просмотра
1

ответ
MySQL

Простой
Как сохранить mysql базу?
- 1 подписчик
- 21 апр.
- 86 просмотров
1

ответ
PHP

+1 ещё

Простой
Как исправить ошибку Uncaught Error: Call to undefined function mysql_real_escape_string?
- 1 подписчик
- 21 апр.
- 100 просмотров
3

ответа
PHP

+2 ещё

Средний
Ошибка при регистрации PHP, в Unity, что делать?
- 1 подписчик
- 20 апр.
- 93 просмотра
1

ответ
MySQL

Простой
Объясните CASE WHEN THEN?
- 1 подписчик
- 20 апр.
- 105 просмотров
2

ответа
MySQL

Простой
Как обновить определенные значения в базе, в зависимости от значения переменной?
- 1 подписчик
- 20 апр.
- 42 просмотра
1

ответ
JavaScript

+2 ещё

Средний
Как я могу сделать поиск по нескольким значениям в js используя elasticsearch?
- 1 подписчик
- 20 апр.
- 50 просмотров
1

ответ
PHP

+2 ещё

Простой
Как в Drupal 10 массово проставить noindex для >1000 страниц?
- 1 подписчик
- 18 апр.
- 51 просмотр
1

ответ
MySQL

+1 ещё

Средний
Как восстановить базу данных mysql, если служба mysql не запускается на windows?
- 1 подписчик
- 18 апр.
- 106 просмотров
1

ответ
Показать ещё Загружается…

Программист C++ Builder / базы данных MySQL

RU Electronics • Москва

от 180 000 до 200 000 ₽

Инженер технической поддержки с английским языком и знанием PHP/MySQL

IT-Aces

от 100 000 до 150 000 ₽

PHP FullStack Developer (Middle+)

ГК «Талант» • Сочи

от 100 000 до 200 000 ₽

Необходимо отверстать страницу сайта с мобильной версией и адаптивным

23 апр. 2024, в 17:59

1000 руб./в час

Разместить объявления на Авито

23 апр. 2024, в 17:47

10000 руб./за проект

Осуществлять оптовые продажи товаров для дома

23 апр. 2024, в 17:43

30000 руб./за проект

Answer 1 · 2017-07-21 16:07:07

Натравить analyzer ниже, вписав его в индекс и к нужным полям:

{
  "settings": {
    "analysis": {
      "analyzer": {
        "address_analyzer_toster": {
          "tokenizer": "whitespace",
          "char_filter": [
            "useless_symbols",
          ],
          "filter": "useless_words": {
                    "type":       "stop",
                    "stopwords": ["ул", "д", "проезд", ...]
          }
        }
      },
      "char_filter": {
        "useless_symbols": {
          "type": "pattern_replace",
          "pattern": "[,\.:].*",
          "replacement": ""
        }
      }
    }
  }
}

Как организовать автокомплит адреса в Elasticsearch?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт