Можно ли решить с помощью нейронной сети?

Question

Benderlidze @Benderlidze

Нейронные сети

Можно ли решить с помощью нейронной сети?

Задача следующая — есть база объявлений о недвижимости.
необходимо структурировать данные из объявлений.
т.е. цена, этаж, общая площадь.
Все объявления написаны в произвольном формате.
Можно ли как-то решить с помощью нейронной сети?
если да, то какой алгоритм смотреть?
Спасибо.

Вопрос задан более трёх лет назад
3682 просмотра

Комментировать

Подписаться 7 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 6

Комментировать

1 комментарий

3 комментария

Benderlidze @Benderlidze Автор вопроса

необходимо из объявления вытянуть данные по цене и площади квартиры, но в каждом объявлении она заданы в произвольной форме, к примеру цена 20.000 или 20 тыс или 20 000 и т.д.

Написано более трёх лет назад
bekbulatov @bekbulatov

Тогда я бы отнес это скорее относится к извлечению информации. Нейронные сети тут вряд ли помогут, может достаточно правил на основе регулярных выражений?

Написано более трёх лет назад
Benderlidze @Benderlidze Автор вопроса

сейчас реализовано так, в принципе получается, но довольно много ошибок, хотелось бы их минимизировать и заодно и разобраться с нейронными сетями.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Нейронные сети

+1 ещё

Средний
Существует ли аналог GPTs?
- 3 подписчика
- 16 апр.
- 1044 просмотра
3

ответа
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- 16 апр.
- 72 просмотра
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 84 просмотра
0

ответов
Python

+2 ещё

Средний
Как преобразовать эмбеддинг текста в понятный сверточным слоям?
- 2 подписчика
- 05 апр.
- 72 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+2 ещё

Простой
Что технически(какие it решения, технологический стек) нужны для создания ии ,который сможет на основе жалоб ставить диагноз?
- 1 подписчик
- 21 мар.
- 113 просмотров
3

ответа
Python

+1 ещё

Простой
Как адаптировать модели logpai loglizer для поиска аномалий в логах java приложения?
- 3 подписчика
- 13 мар.
- 227 просмотров
0

ответов
Машинное обучение

+1 ещё

Сложный
Как реализовать обучение нейросети в реальном времени?
- 2 подписчика
- 11 мар.
- 161 просмотр
2

ответа
Нейронные сети

+1 ещё

Средний
Какие есть малотребовательные нейросети для обнаружения людей?
- 1 подписчик
- 09 мар.
- 127 просмотров
0

ответов
Python

+4 ещё

Простой
Как решить ошибку библиотеки g4f?
- 1 подписчик
- 01 мар.
- 614 просмотров
1

ответ
Показать ещё Загружается…

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Агент поддержки

PulseGPT

от 25 000 до 35 000 ₽

Computer vision developer

TQB - хай-тек рекрутмент по-хардкору • Москва

от 300 000 ₽

Разработать интранет сайт (корпоративный портал)

20 апр. 2024, в 07:24

100000 руб./за проект

Исправить адаптивную верстку на Tilda Zero Block

20 апр. 2024, в 06:39

4000 руб./за проект

Доработка аддона для Xenforo v2.2.13

20 апр. 2024, в 06:06

200 руб./за проект

Answer 1 · 2011-07-03 15:50:16

mark_ablov @mark_ablov

это называется Data Mining, думаю это поможет в поиске вариантов в гугле.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2011-07-03 22:37:22

Любую задачу в принципе можно свести к нейронной сети, но в вашем случае, запаритесь ее обучать, к тому же нужны данные для обучения, т.е. неск. сотен (тысяч) объявлений, в которых цена, площать и т.п помечены.

Сводим задачу к классификации группы чисел, т.е. подразумеваем, что все группы чисел в тексте будут иметь один из следующих классов: цена, площадь, этаж.

Для начала нужен хороший токенизатор: пишете скрипт, который разбивает текст объявления на слова, при этом стараемся чтобы числа были в одной группе. Например: «продаю 3-х комнатную квартиру за 5000 руб.» => («продаю», «3», "-", «х», «комнатную», «квартиру», «за», «5000», «руб», ".").

Затем создаете простой интерфейс для аннотации текста. Т.е. берем, скажем 1% от всех объявлений и от руки отмечаем, где цена, где площадь. Результат будет примерно таков: {«продаю» => '', «3» => ROOM, "-" => '', «х» => '', «комнатную» => '', «квартиру» => '', «за» => '', «5000» => PRICE, «руб» => '', "." => ''}. Это будут данные для обучения.

Теперь создаем нейронную сеть. Возьмем многослойный персептрон с 3-мя слоями: входной уровень — наши данные, скрытый уровень и выходной уровень — сигналы классов. В выходном уровне будет кол-во узлов по кол-ву классов, т.е. 3 (цена, площадь, кол-во комнат). Можно добавить 4-й узел для отсутствия класса. Входной слой содержит узлы характеристик данных. В качестве характеристик можно взять N-слов до числа и N-слов после. Число N можно варьировать (скажем, от 1 до 10 т.е. 10 разных сетей). В итоге будет громадный входной слой с кол-вом узлов NxM, где M — это наш словарь, т.е. все встречающиеся в объявлениях слова. Входные данные будут такие: (0, 0, 0,… 1, 0, 0, ....) — для каждой из N групп, т.е. 1 будет обозначать что слово присутствует в окне. Выходные данные будут (1, 0, 0) для цены, (0, 1, 0) для площади, (0, 0, 1) для кол-ва комнат. В скрытом слое ставим кол-во узлов наугад… ну, скажем, пусть, будет N.

Проводим обучение на 1% размеченных данных пока не сойдется обучение. Можно варьировать число N и смотреть какой вариант дает лучший результат. Потом пытаемся разметить оставшиеся данные с полученной сетью.

Не уверен, что это оптимальный вариант :)

Answer 3 · 2011-07-03 16:57:29

Не совсем понятна ваша задача, но могу посоветовать книгу «Программируем коллективный разум» Тоби Сегарана. В книге рассматриваются подобные алгоритмы на питоне. Думаю найдете что-то полезное для себя.

Answer 4 · 2011-07-04 00:01:29

Именно нейронная сеть тут вряд ли поможет, это задача Text Mining.
Конкретно в Вашем случае я бы предложил решить ее перечислением встречающихся в тексте паттернов, а потом применил бы бустинг, как здесь: habrahabr.ru/company/mailru/blog/112142/

Answer 5 · 2011-07-04 18:08:57

Чисто теоретически на нейронках можно реить любую задачу, решаемою компьютером, тут скорее вопрос в целесообразности. В данном случае использовать НС не оптимально.

Answer 6 · 2014-09-25 15:48:52

Используйте Томита-парсер Яндекса. Он для этого хорошо может подойти. Только придется, конечно, написать правила.

Можно ли решить с помощью нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт