Какие библиотеки использовать, чтобы собирать данные с сайтов?

Есть идея создания скрипта, который собирает данные с сайтов (в основном статистические показатели ) для дальнейшего использования в построении графика.

Какие инструменты и библиотеки мне для этого использовать? Писать планирую на Python.

UPD: Проект для личного развития :)
  • Вопрос задан
  • 614 просмотров
Пригласить эксперта
Ответы на вопрос 3
Vlad_IT
@Vlad_IT
Front-end разработчик
1) Самый крутой scrapy
2) Для любителей css query https://lxml.de/cssselect.html
3) Еще довольно мощный beautifulsoup
Ответ написан
Python + requests + beatysoup = в одном потоке может херачить примерно 10000 страниц за 15-20 минут.

Если прямо надо автоматизация, потоки и прочее - то уже scrappy
Ответ написан
@gpm7315
В большинстве случаев urllib+lxml. Еще grab интересная штука.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы