Спарсить данные с сайта?

Question

tofel @tofel

Спарсить данные с сайта?

Всем привет подскажите как и чем спарсить этот сайт.

import requests

url =  "https://mobile.888.ru/sport/search?text=%D0%9B%D0%B8%D0%B2%D0%B5%D1%80%D0%BF%D1%83%D0%BB%D1%8C"

r = requests.get(url)

print(r.text)

К сожалению сайт парситься не полностью, и ссылки не появляются. Знаю что есть selenium но хотелось бы узнать есть ли еще способ чем можно спарсить ссылки на футбольные команды.

Вопрос задан более трёх лет назад
197 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

1 комментарий

tofel @tofel Автор вопроса

Нашел еще решение.

import requests_html
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://mobile.888.ru/sport/search?text=%D0%9B%D0%B8%D0%B2%D0%B5%D1%80%D0%BF%D1%83%D0%BB%D1%8C')


r.html.render(sleep=5)



print(r.html.html)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 9 часов назад
- 74 просмотра
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 13 часов назад
- 80 просмотров
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 15 часов назад
- 115 просмотров
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 1 подписчик
- 15 часов назад
- 18 просмотров
0

ответов
Python

+2 ещё

Простой
Почему Планировщик задач Windows 10 не выполняет скрипт Python?
- 2 подписчика
- 21 час назад
- 520 просмотров
2

ответа
Python

+1 ещё

Средний
Как переместить мышь вместе с элементом в pyppeteer?
- 1 подписчик
- вчера
- 84 просмотра
0

ответов
Python

+2 ещё

Простой
OK.RU, API приложений, не могу загрузить видео: User must grant an access to permission 'VIDEO_CONTENT'". Как получить этиправа для приложения?
- 1 подписчик
- вчера
- 50 просмотров
1

ответ
Python

+1 ещё

Средний
Сервер C# не принимает сообщения от клиента. Почему так?
- 1 подписчик
- 21 апр.
- 112 просмотров
0

ответов
Python

Простой
Что я делаю не так Python?
- 1 подписчик
- 21 апр.
- 163 просмотра
3

ответа
Python

+1 ещё

Простой
Как запустить два параллельных процесса бота: бесконечную функцию, проверяющую имеются ли обновления, и обработчики событий и сообщений?
- 1 подписчик
- 20 апр.
- 130 просмотров
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Установить верстку на WP

23 апр. 2024, в 07:22

4999 руб./за проект

Доработать мобильное приложение на Swift

23 апр. 2024, в 06:07

1500 руб./в час

Доработать мобильное приложение на Kotlin

23 апр. 2024, в 06:05

1500 руб./в час

Answer 1 · 2019-11-09 19:03:39

Видимо без selenium не обойтись

from selenium import webdriver
from selenium.webdriver.firefox.options import Options
import time

options = Options()
options.headless = True

driver = webdriver.Firefox(options=options,executable_path=r"C:\geckodriver.exe")
driver.set_page_load_timeout (30)
driver.get('https://mobile.888.ru/sport/search?text=%D0%9B%D0%B8%D0%B2%D0%B5%D1%80%D0%BF%D1%83%D0%BB%D1%8C')
time.sleep(3)
html = driver.page_source
print(html)

Answer 2 · 2019-11-08 23:39:16

Dimonchik @dimonchik2013

non progredi est regredi

смоотри код страницы

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2019-11-08 23:40:38

В requests добавьте хедеры аналогичные тем что отправляет браузер, который получает результаты полностью.

Answer 4 · 2019-11-09 03:14:47

там javascript, без selenium и движка (минимум phantomjs, оптимально chrome --headless) не получится спарсить

for FeNUMe:

# -*- coding: utf-8 -*-
import sys
if sys.hexversion < 0x03000000:
    from urllib import urlopen
    from urllib import URLopener
else:
    from urllib.request import urlopen
    from urllib.request import URLopener


useragent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36"
URLopener.version = useragent

text = urlopen('https://mobile.888.ru/sport/search?text=%D0%9B%D0%B8%D0%B2%D0%B5%D1%80%D0%BF%D1%83%D0%BB%D1%8C')
print text.read()

Спарсить данные с сайта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт