@pcdesign

Как искать цитаты в тексте с помощью python?

Мне надо проверить валидность цитат, что цитата на самом деле принадлежит перу данного автора.
Вот для примера цитата:
Несмотря на то, что доктора лечили его, пускали кровь и давали пить лекарства, он все-таки выздоровел.

Лев Толстой ВОЙНА И МИР
Или вот вариант по-сложнее:
...в военном деле ничего не значат самые глубокомысленно обдуманные планы (как он видел это в Аустерлицком походе) <...> все зависит от того, как отвечают на неожиданные и не могущие быть предвиденными действия неприятеля, что все зависит от того, как и кем ведется все дело...

Это тоже Лев Толстой ВОЙНА И МИР.
Тут есть сокращения, которые допустимы при цитировании, но как быть, когда нужно найти это в тексте?

Как лучше сделать такую проверку?

P.S: Все тома Войны и Мира:
modernlib.net/series/voyna_i_mir
Правила оформления и сокращений цитат:
new.gramota.ru/spravka/letters/54-rubric-76
  • Вопрос задан
  • 148 просмотров
Решения вопроса 1
Zarom
@Zarom
Мастер на все руки из жопы
Текст довольно велик и первое пришедшее в голову - построение и поиск регулярным выражением по указанным правилам - будет малоэффективен.
Если таких текстов будет множество, а не только "Война и Мир", то стоит задуматься о применении полнотекстовой поисковой системы, напр. Elasticsearch.
Если это учебный проект, можно попробовать обойтись 1-ым способом.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
shpaker
@shpaker
Вольный хлебопашец
Искать отдельно вхождения всех частей между точками в нужном порядке?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через TM ID
Похожие вопросы
от 140 000 до 180 000 руб.
YLab Тольятти
от 90 000 до 150 000 руб.
Битворкс Томск
от 120 000 руб.
16 янв. 2019, в 10:30
5000 руб./за проект
16 янв. 2019, в 10:29
1000 руб./за проект
16 янв. 2019, в 09:06
500 руб./в час