Dablg
@Dablg
Вян

Как реализовать поиск слов с опечатками или незначительными разночтениями?

Есть корпус слов, для каждого из которых нужно найти неточные совпадения в тексте, с возможностью опечаток или отличий в одном - двух символах. Например: color - colour, gray - grey и т.п. Для длинных слов отличий может быть больше.

Заранее спасибо за ответ!
  • Вопрос задан
  • 68 просмотров
Пригласить эксперта
Ответы на вопрос 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Считайте подряд идущие верные буквы и буквы-несовпадений (пропущена, любая лишняя, другая вместо нужной), запоминаете расстояния для всех ошибочных цепочек.
Затем вычитаете из минимальной длины строки все ошибочные расстояния и делите на длину этой минимальной строки. Получаете коэффициент несовпадения. Умножив его на 100 - получите процент несовпадения строк.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через TM ID
Похожие вопросы