Vope
@Vope
Java Software Engineer

Обработка текста на Java?

Есть таблица с работниками, в которой хранятся ФИО. Какие есть способы выбрать нужного работника, если в ФИО допущены опечатки, может, есть какая либа подобного профиля?
  • Вопрос задан
  • 345 просмотров
Решения вопроса 1
longclaps
@longclaps
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
al_gon
@al_gon
Всё завистит от количества работников.
Если помещаются в память, то попробуйте java-string-similarity иначе поисковый сервер.

И вообще, все метрики основанны на сравенении 1:1. Тоесть если у вас есть 1К работников, это 1К проверок.
Для скорости нужен поисковый индекс, он не обязательно должен быть полноценным поисковым движком, но принцыпы Inverted_index должен реализовывать (Example: Inverted_index#Java).
Так как вы ищете не по словам, а в словах, то нужна более точная единица, чем слово, а именно N-gram.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы