Какой алгоритм использовать для нахождения соответствия между данными и словарем?

Данные и словарь представляют из себя наборы строк. В данных те же строки из словаря, но с опечатками, с перестановками слов, с лишними или недостающими словами и т.п.
Нужно составить соответствие - какой строке из словаря соответствует строка из данных.

Возможно стоит посмотреть в сторону алгоритмов машинного обучения. Тогда подскажите какого именно.
  • Вопрос задан
  • 625 просмотров
Пригласить эксперта
Ответы на вопрос 2
Как вариант, воспользоваться алгоритмами нечеткого поиска:
algolist.manual.ru/search/fsearch
habrahabr.ru/post/123320
habrahabr.ru/post/114997
Ответ написан
@beduin01
Сама реализация алгоритма: https://neil.fraser.name/software/diff_match_patch...
Diff-Match-Patch (версия для D). Версии для других языков можно взять тут
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы