erniesto77
@erniesto77
oop, rb, py, php, js

Как извлечь все диалоги из текста книги или из текста сценария фильма?

привет. Подскажите в общих чертах, как извлечь из текста все диалоги в формате вопрос-ответ. Например хочу тренировать чат-бота по книге "Этикет юного джентльмена". Язык программирования любой

спасибо!

UPDATE: допустим мы извлекли все строки начинающиеся с тире. А можно как то узнать еще и автора фразы? Если получится, то таким образом мы сможем извлечь диалоги с участием конкретного персонажа. Было бы круто. Как вариант можно сначала распарсить всех главных героев из текста, а потом искать авторов диалога перед начальной строкой по первому вхождению, но это не точно.

Главных героев можно получить примерно так: начинаются с большой буквы и повторяются в тексте часто (число частотности будет зависеть от длины текста), но это условие выглядит не надежно. Надо еще отбросить глаголы. Возможно есть библиотеки которые определяют форму речи. Буду искать. Или лучше просто самому создать список главных героев, так будет надежнее всего наверно
  • Вопрос задан
  • 336 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
из титров

потом по ним натренируешь из книг, но не бота, а сеть
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы