Парсинг при помощи lxml и сохранения данных при помощи pandas

Question

ikudza @ikudza

Парсинг при помощи lxml и сохранения данных при помощи pandas

Вдохновившись статьей на хабре, пытаюсь написать парсер. Код ниже:

import lxml.html as html
from pandas import DataFrame

main_domain = 'http://market.yandex.ru'
brand_list = html.parse('%s/brands-list.xml' % (main_domain))

e = brand_list.getroot().find_class('body')
for i in e:
    t = i.getchildren().pop()
    link_table = DataFrame({'EV':j[0].text , 'LINK':j[2]} for j in t.iterlinks())

link_table.to_csv('brands1.csv',';',index=False,encoding="UTF-8")

Вылетает ошибка UnicodeDecodeError: 'utf8' codec can't decode byte 0xd0 in position 4: unexpected end of data
Что я делаю неправильно?

Вопрос задан более трёх лет назад
3655 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- 9 часов назад
- 70 просмотров
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- 9 часов назад
- 47 просмотров
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- вчера
- 171 просмотр
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- вчера
- 133 просмотра
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- вчера
- 155 просмотров
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 2 подписчика
- вчера
- 29 просмотров
0

ответов
Python

+2 ещё

Простой
Почему Планировщик задач Windows 10 не выполняет скрипт Python?
- 3 подписчика
- вчера
- 1632 просмотра
3

ответа
Python

+1 ещё

Средний
Как переместить мышь вместе с элементом в pyppeteer?
- 1 подписчик
- 21 апр.
- 90 просмотров
0

ответов
Python

+2 ещё

Простой
OK.RU, API приложений, не могу загрузить видео: User must grant an access to permission 'VIDEO_CONTENT'". Как получить этиправа для приложения?
- 1 подписчик
- 21 апр.
- 54 просмотра
1

ответ
Python

+1 ещё

Средний
Сервер C# не принимает сообщения от клиента. Почему так?
- 1 подписчик
- 21 апр.
- 125 просмотров
0

ответов
Показать ещё Загружается…

Python developer

Bell Integrator

До 350 000 ₽

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

TeamLead Python

AGIMA • Москва

До 350 000 ₽

Анимация логотипа

24 апр. 2024, в 00:08

20000 руб./за проект

Разработка дизайна раздела «Статьи» на сайте «Мир отходов»

23 апр. 2024, в 23:01

10000 руб./за проект

Дизайн личного кабинета (клиентская часть)

23 апр. 2024, в 22:37

500 руб./в час

Answer 1 · 2014-05-22 22:20:59

Арсений Кравченко @Arseny_Info

R&D engineer

for i in e:
    t = i.getchildren().pop()
    link_table = DataFrame({'EV':j[0].text.encode('utf-8') , 'LINK':j[2]} for j in t.iterlinks())

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2014-05-24 22:09:51

Freesty1er @Freesty1er

А какой статьей вдохновились?

Ответ написан более трёх лет назад

Комментировать

Парсинг при помощи lxml и сохранения данных при помощи pandas

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт