@dodo101000101

Как из текста вытащить определения слов?

Здравствуйте, мне необходимо вытащить из текста определения слов, т.е. те предложения, в которых словам даётся определение в явном, а в идеале, и неявном виде.

Большое количество определений подходит под конструкцию: "Понятие - его определение.". Есть ли какие-то готовые наработки, позволяющие найти в тексте подобные грамматические конструкции?

Есть ли работы в которых пытаются выявить значение слов из контекста?

Интересуют конкретные кейсы (реализации), доклады, научные статьи и таму подобное по данной теме.
  • Вопрос задан
  • 258 просмотров
Пригласить эксперта
Ответы на вопрос 5
samodum
@samodum
Чем не устраивают регулярки?
\w+ \- это \w+
Это решение полностью подходит под описанную задачу
Ответ написан
Adamos
@Adamos
Вам действительно нужно обработать какой-то текст или нужна база определений? Так-то в сети навалом словарей, в которых сделана готовая разметка и не нужно морщить лобик.
Ответ написан
@yevhprodan
Хороший подход для этого будет использование nlp. К примеру библиотека Spacy
Ответ написан
@mayton2019
Ent. Software engineer.
Это сложная и интересная тема. На выходе ее должна стоять семантическая сеть. И есть у меня сомнения что на тостере кто-то даст окончательный совет. Да и вообще нельзя тут дать совет. Тут нужно направление. Как. Кодить самому? Или взать опенсорцную библиотеке? Или купить библиотеку.

Мне также интересно откуда проистекает это техническое задание. Как минимум - дипломный проект.
Ответ написан
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Слова в предложении:
^наз?в*, ^означ*, ^явля?т*, ^это$, ^определя?т*, ^представля?т*, ^выража?т*
И/или знак "тире".
Меньшая часть предложения - это термин (или в начале, или в конце предложения).
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы