Реально ли выполнить данное тз средствами веб языков?

Существует множество прайс-листов.
Часть из них имеет более менее структурированный вид в XLS с разбиением на категории, типы, цвета и тд.
Большая же часть прайсов (90%) записаны в произвольной форме, чуть ли не в txt.
Они тоже имеют какое то более менее разбиение по строкам, с выделением жирным шрифтом названий и тд, но оно понятно сугубо на уровне чтения человеком, а не машиной.
Возможно ли создать какой то универсальный парсер для разных типов данных, который бы приводил все это месиво в стандартизированный вид? Или это в принципе нереально сделать с использованием веб языков?
Проскакивали идеи по поводу использования Томита, но он не совсем подходит под данную задачу.
Вопрос сам по себе расплывчатый, тк я до конца сам не понимаю с той ли стороны я подошел к задаче.
  • Вопрос задан
  • 1214 просмотров
Пригласить эксперта
Ответы на вопрос 6
nazarpc
@nazarpc
Open Source enthusiast
Какая разница какой язык? Чисто технически то, что можно сделать на C, Java, PHP можно так же сделать на Brainfuck.
Любой полноценный веб-язык способен такое сделать, вопрос сам по себе не имеет смысла в принципе, к тому же ответ на него вам по сути ничего не даст, а исходя из постановки вопроса - тем более...
Ответ написан
Комментировать
hahenty
@hahenty
('•')
Человекочитаемый вид предполагает какую-то группировку слов и чисел, выделение заголовков категорий, еще какой-то критерий разделения. Так что можно делать разбивку прямо так, как видят глаза. Выделить один тип слов и словосочетаний, потом другой, учитывать какие-нибудь ключевые слова, даже количество переносов можно считать. Группы слов с описанием позиций прайс-листа явно будут с указанием цены — а это самый верный разделитель.
В принципе, распарсить прайс-листы реально. Главное, чтобы их писали адекватные люди.

А "вебнутость" языков программирования не имеет значения.
Ответ написан
sim3x
@sim3x
Без https://tech.yandex.ru/tomita/ тебе придется разбирать синтаксис и все остальное самому, что приведет к космическим суммам за реализацию
Ответ написан
saboteur_kiev
@saboteur_kiev
software engineer
Если бы было можно написать программное обучение чему-либо, уже бы было куча искуственного интеллекта, но до сих пор все самообучающие алгоритмы проходят под строгим контролем, и никак иначе. Автоматическое обучение - нереально, оно ВСЕГДА будет допускать ошибки, и следовательно требовать доработку.

Проще для каждого отдельного прайса написать свой парсер, а вот это может сделать даже низкоквалифицированный специалист на любом языке программирования.
Ответ написан
Комментировать
Akdmeh
@Akdmeh
PHP, Yii2, Music
Это возможно реализовать на веб-языках теоретически.
На практике это будет стоить тысячи долларов и целая команда разработчиков, которые имеют огромный опыт в создании нейронных сетей.
Так что нужно какой-то общий формат или заказывать ручную работу человека со всяческой удобной оптимизацией работы.
Ответ написан
@vSk
директор по развитию
Ответ на этот вопрос модно дать лишь после уточнения цели. Здесь, как говориться, цель оправдывает средства... Или не оправдывает) а так, запрограммировать можно все.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы