butteff
@butteff
Раз в тысячу лет заправляю свитер в носки

Где взять список хороших и плохих слов?

Нужен список слов для анализа мнений, хороших и плохих, где взять? К примеру "кот ужасен" слово ужасен должно быть в списке. Или котик няшка - няшка - в списке хороших. Вот где можно взять эти списки? И как быть с матом? Ведь х%ево и ох%енно не одно и то же, поэтому тупо добавить список мата нельзя, надо и его бы разбить, есть где разбитый?
  • Вопрос задан
  • 4379 просмотров
Решения вопроса 3
qmax
@qmax
программер
распарсить кучу отзывов, где оценки выставлены вручную и есть текст (flamp, google play market)

взять все слова из текста отзыва, отбросить окончания и каждое слово использовать как бинарное входное значение для логистической регрессии, например.
ну или нейросеть замутить, чтобы сочетания роляли.
Ответ написан
Комментировать
@xandox
либо купить (честно говоря, даде не знаю от куда начать поиски продавцов), либо самомоу разметить, либо отдать разметку на оутсорс.
Ответ написан
Комментировать
@art_karetnikov
Лучший мой проект: Мобильный банк Сбербанка РФ.
поискать словари синонимов и по ним прогнать потом свой набор? Знаю как минимум одного разработчика, у которого такие словари есть уже в виде базы - solarix, сверх того - и погуглить можно. :)
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@Stan_1
Я таким пытался заморочить, смотрел англоязычные API для определения эмоциональности поста, пытался их прикрутить к одному Интернет-магазину. Но увы, чаще всего, комментарий выглядел как "Идея мне очень нравится, свежо и оригинально, но реализация - фигня". То есть по сути, хотя отзыв отрицательный, алгоритмы их считают положительными, поскольку положительных слов больше. В итоге плюнул, так и не сделал.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы