Библиотека для парсинга lxml

Question

IgaIst @IgaIst

Python
lxml

Библиотека для парсинга lxml

Проблема с парсингом тега «link» в библиотеке lxml

Собственно код:

import lxml.html
xml = '<link>trololo</link>'
doc = lxml.html.document_fromstring(xml)
out = doc.cssselect('link')[0]
print out.text

Всё выполняется, но на выходе получаем:
None

Если заменить тег «link», на любой другой, то проблема исчезает.

Собственно: я в недоумении! Сталкивался ли кто-то с подобным непонятночем?
Или может кто-то подобную(простенькую, маленькую, лёгенькую) либу посоветует?

Вопрос задан более трёх лет назад
4498 просмотров

2 комментария

Подписаться 5 Оценить 2 комментария

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Как получить список приглосительных ссылок в телеграм канале?
- 1 подписчик
- 4 часа назад
- 10 просмотров
0

ответов
Python

Простой
Пишу Todolist появилась ошибка, как исправить?
- 1 подписчик
- 7 часов назад
- 24 просмотра
0

ответов
Python

+1 ещё

Простой
Как решить проблему с терминалом PyCharm?
- 1 подписчик
- 7 часов назад
- 22 просмотра
0

ответов
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 8 часов назад
- 14 просмотров
0

ответов
Python

+2 ещё

Средний
Возможно ли сделать так, чтобы Telegram GPT-Yandex.Cloud Бот отвечал не только на текстовые сообщения, но и на картинки? И если да, то как?
- 1 подписчик
- 8 часов назад
- 35 просмотров
2

ответа
Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- 11 часов назад
- 27 просмотров
0

ответов
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 15 часов назад
- 65 просмотров
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 16 часов назад
- 16 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 17 часов назад
- 57 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- вчера
- 118 просмотров
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Привязка к Маркетплейсам 1С Розница 2.3

20 апр. 2024, в 05:26

10000 руб./за проект

Дописать функцию на Flutter, работа с yandex map kit

20 апр. 2024, в 04:18

3000 руб./за проект

Английская версия для сайта на WordPress

20 апр. 2024, в 03:34

8000 руб./за проект

Answer 1 · 2013-08-14 11:59:33

syschel натолкнул на очень хорошую мысль: я ведь xml парсю html-модулем)

Решение:

from lxml import etree
doc = etree.XML('<link>trololo</link>')
out = doc.xpath('/link')[0].text
print out

Answer 2 · 2013-08-13 22:47:43

То же самое будет, если заменить link на br или img.
Думаю, дело в том, что теги link, br, img по стандарту одиночные, а тут представлены парными.

Библиотека для парсинга lxml

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт