Как правильно парсить XML с xml.dom.minidom?

Question

Apothecary @Crjk

Как правильно парсить XML с xml.dom.minidom?

Пытаюсь распарсить XML с помощью minidom.
Возникло несколько вопросов:
1. Как можно выбирать Тег в Теге, например есть структура:

<tag1>
 <tag2></tag2> 
<tag1>
<tag1>
 <tag3></tag3>
</tag1>
<tag2></tag2>

Как мне получить доступ к tag2 внутри tag1? Пробовал нечто вроде:

a = doc.getElementsByTagName("tag1 > tag 2")
a = doc.getElementsByTagName("tag1  tag 2")

2. Правильно я понимаю, что лучший способ получить значение внутри тэга это:
print(a.childNodes[0].nodeValue)
3. Мне нужно вставить результаты парсинга в csv. Мой план такой
- Получаю список интересующих меня нодов (около 100 нодов одинаковой структуры)
- Обрабатываю нод и загоняю интересующие меня цифры в массив [ .. ]
- Перед переходом к след. ноду загоняю массив из п. выше в новый массив (итоговый)
- Затем каждый элемент из массива выше вставляю в csv + разделитель
Хороший ли это вариант или лучше сделать по-другому?
4. for по нодам работает на внутренние уровни? Например есть структура:

<tag1>
 <tag2>
  <tag3></tag3>
 </tag2>
 <tag4>
 </tag4>
</tag1>

если я сделаю for по элементам ноды tag1, пройдет ли цикл по tag3 или только по tag2 и tag4 ?

Спасибо за ответы

Вопрос задан более трёх лет назад
175 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

JavaScript

+1 ещё

Простой
Как подключить кошелёк к web3 сайту?
- 1 подписчик
- минуту назад
- 2 просмотра
0

ответов
Python

Простой
Выполнение парсинга странцы?
- 1 подписчик
- 29 минут назад
- 18 просмотров
1

ответ
Парсинг

Средний
Как парсить сайты на Wordpress в определённой доменной зоне?
- 1 подписчик
- час назад
- 10 просмотров
3

ответа
Python

+1 ещё

Средний
Как правильно написать многоуровневое меню для телеграмм бота в библиотеке telebot?
- 1 подписчик
- 2 часа назад
- 18 просмотров
2

ответа
Python

+1 ещё

Простой
Как SQL запрос переделать для sqlalchemy?
- 1 подписчик
- 7 часов назад
- 58 просмотров
1

ответ
Python

+1 ещё

Простой
Как применить функцию для всего датафрейма pandas?
- 1 подписчик
- 7 часов назад
- 40 просмотров
1

ответ
Python

+3 ещё

Простой
Можно ли сменить аватарку бота telegram без botfather?
- 2 подписчика
- 9 часов назад
- 148 просмотров
2

ответа
Python

Простой
Как исправить ошибку?
- 1 подписчик
- 12 часов назад
- 84 просмотра
1

ответ
Python

Простой
Что не так с кодом Python?
- 1 подписчик
- вчера
- 143 просмотра
1

ответ
Python

+1 ещё

Простой
Как локализовать label в декораторе button ui?
- 1 подписчик
- вчера
- 29 просмотров
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 до 200 000 ₽

Спарсить список MCC-кодов

16 апр. 2024, в 22:27

1000 руб./за проект

Нужен контент менеджер кто сможет помочь с контентом сайтов

16 апр. 2024, в 22:11

80000 руб./за проект

Провести итерацию улучшения сайта UX/UI/текст/seo

16 апр. 2024, в 22:04

5000 руб./за проект

Answer 1 · 2019-11-07 16:07:02

getEltmentsByTagName("tag1 tag 2") тебе ничего не вернет, это выбор уже по xpath, а не по тэгу.
getEltmentsByTagName("tag1") и затем перебирать все ноды и у них вытаскивать уже следующий тэг.
Либо ищи в либе методы для выборки по xpath либо по css селекторам.

Как правильно парсить XML с xml.dom.minidom?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт