Ответы пользователя по тегу Автоматизация обработки текста
  • Алгоритм сравнения текстовых строк?

    @dmitryim
    Дополнительно, после разбиения строки на слова, их можно сравнивать с помощью levinshtein(). Потом с учетом длины слова получать коэффициент похожести. Таким образом можно с довольно точно определять схожесть, даже если допущена опечатка в слове, или если оно написано немного иначе.
    Ну и дополнительный бонус — транслитерация строки и очистка ее от мусора.
    Ответ написан
    Комментировать