@beduin01

Как лучше организовать многопоточный парсер xml?

Есть несколько сотен тысяч XML файлов, которые нужно распарсить и выгрузить в БД. Для разбора использую XPATH. Проблема в том, что если их выгружать по одному процесс идет слишком медленно.

Стоит ли мне пытаться вынести каждый отдельный скрипт в поток? Или есть какие-то другие варианты?

Проблема еще в том, что я хочу парсить результат отработки каждого отдельного файла, чтобы знать прошла ли успешно обработка или данный файл имеет отличную от ожидаемой структуру. Иными словами сейчас я просто паршу выдачу скрипта.

Как все это лучше организовать?
  • Вопрос задан
  • 220 просмотров
Пригласить эксперта
Ответы на вопрос 1
inoise
@inoise
Solution Architect, AWS Certified, Serverless
RabbitMQ как брокер и воркеров пока машина не лопнет
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы