Как правильно парсить XML с xml.dom.minidom?

Question

Apothecary @Crjk

Как правильно парсить XML с xml.dom.minidom?

Пытаюсь распарсить XML с помощью minidom.
Возникло несколько вопросов:
1. Как можно выбирать Тег в Теге, например есть структура:

<tag1>
 <tag2></tag2> 
<tag1>
<tag1>
 <tag3></tag3>
</tag1>
<tag2></tag2>

Как мне получить доступ к tag2 внутри tag1? Пробовал нечто вроде:

a = doc.getElementsByTagName("tag1 > tag 2")
a = doc.getElementsByTagName("tag1  tag 2")

2. Правильно я понимаю, что лучший способ получить значение внутри тэга это:
print(a.childNodes[0].nodeValue)
3. Мне нужно вставить результаты парсинга в csv. Мой план такой
- Получаю список интересующих меня нодов (около 100 нодов одинаковой структуры)
- Обрабатываю нод и загоняю интересующие меня цифры в массив [ .. ]
- Перед переходом к след. ноду загоняю массив из п. выше в новый массив (итоговый)
- Затем каждый элемент из массива выше вставляю в csv + разделитель
Хороший ли это вариант или лучше сделать по-другому?
4. for по нодам работает на внутренние уровни? Например есть структура:

<tag1>
 <tag2>
  <tag3></tag3>
 </tag2>
 <tag4>
 </tag4>
</tag1>

если я сделаю for по элементам ноды tag1, пройдет ли цикл по tag3 или только по tag2 и tag4 ?

Спасибо за ответы

Вопрос задан более трёх лет назад
175 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 2 часа назад
- 21 просмотр
0

ответов
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 4 часа назад
- 29 просмотров
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- 10 часов назад
- 33 просмотра
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- 13 часов назад
- 76 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 133 просмотра
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 218 просмотров
3

ответа
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- вчера
- 134 просмотра
2

ответа
PHP

+1 ещё

Простой
Как получить данные title на TradingView?
- 1 подписчик
- вчера
- 30 просмотров
1

ответ
Python

+1 ещё

Простой
Почему не срабатывает клик по элементу при открытии станицы selenium python?
- 1 подписчик
- 16 апр.
- 51 просмотр
1

ответ
Python

Простой
Выполнение парсинга странцы?
- 2 подписчика
- 16 апр.
- 129 просмотров
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Написать код на python

19 апр. 2024, в 03:01

1000 руб./за проект

Настройка сервера

18 апр. 2024, в 21:56

2000 руб./за проект

Помощь с водпресс

18 апр. 2024, в 21:00

150 руб./за проект

Answer 1 · 2019-11-07 16:07:02

getEltmentsByTagName("tag1 tag 2") тебе ничего не вернет, это выбор уже по xpath, а не по тэгу.
getEltmentsByTagName("tag1") и затем перебирать все ноды и у них вытаскивать уже следующий тэг.
Либо ищи в либе методы для выборки по xpath либо по css селекторам.

Как правильно парсить XML с xml.dom.minidom?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт