Куда вставить таймер Python чтобы работало?

Question

Дарья @darina46722

Куда вставить таймер Python чтобы работало?

Думаю, что нашла решение с получением нужной html страницы. Ранее скарпи получал пустую html.
Т.е. сейчас перед тем как собирать данные со страницы скрапи подождёт 5 секунд (за это время JS код успеет запросить нужный html) и нужная информация соберётся.

Хепните как быть с вставкой таймера плиз.

# -*- coding: utf-8 -*-
import scrapy
from threading import Timer


class ExampleSpider(scrapy.Spider):
    name = 'bc'
    start_urls = [
        'https://www.greatcircus.ru/',
    ]

    def parse(self, response):
        for ticket in response.css('.col-xs-12 schedule-main-tickets-container'):
            event_name = ticket.css('.schedule-main-tickets-show-title::text').extract(),
            place = ticket.css('.schedule-main-tickets-location::text').extract(),
            url = ticket.css('.text-center a::text').extract(),
            yield {
                'event_name': event_name,
                'place': place,
                'url': url,
            }

    t = Timer(5.0, parse)
    t.start()

Сейчас выходит ошибка:

Exception in thread Thread-1:
Traceback (most recent call last):
  File "C:\programs for work\lib\threading.py", line 917, in _bootstrap_inner
    self.run()
  File "C:\programs for work\lib\threading.py", line 1166, in run
    self.function(*self.args, **self.kwargs)
TypeError: parse() missing 2 required positional arguments: 'self' and 'response'

Вопрос задан более трёх лет назад
342 просмотра

1 комментарий

Подписаться 3 Простой 1 комментарий

Решения вопроса 1

3 комментария

antonksa @antonksa

Срапи, это пять. Скарпи у ТС это четыре с плюсом. Ребят, вам так лень переключить раскладку? Задолбали со своими англицизмами.

Что до сабжа, то во-первых, если Дарья верно скопировала разметку, то у нее тред создается прямо при компиляции класса, это что-то новенькое в программировании. Во-вторых, как было верно указано в комментах (а в каких кстати комментах, т.к. я вижу один комент, в котором _ ссылается на другие коменты... в прочем не важно, сбой в матрице), так вот Scrapy только грузит HTML и уж тем более он не исполняет JS. Это отдельная большая тема, и очень больная, если прям действительно так хочется, то нужно гуглить Selenium.

Написано более трёх лет назад
Пашенька @like-a-boss

antonksa,
antonksa:
Задолбали со своими англицизмами.

тоже antonksa:
тред

Написано более трёх лет назад
Дарья @darina46722 Автор вопроса

antonksa, спасибо за подсказку.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- 3 минуты назад
- 3 просмотра
0

ответов
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 3 часа назад
- 56 просмотров
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 5 часов назад
- 14 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 6 часов назад
- 48 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 18 часов назад
- 115 просмотров
1

ответ
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 20 часов назад
- 72 просмотра
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- вчера
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- вчера
- 99 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 140 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 233 просмотра
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Изменить тему Shopify, добавить несколько категорий товаров

19 апр. 2024, в 18:11

10000 руб./за проект

Протестировать веб-сервис на Django и подготовить отчеты

19 апр. 2024, в 18:05

1000 руб./в час

Доработать проект на Django

19 апр. 2024, в 18:02

80000 руб./за проект

Scrapy - это не Selenium, он не исполняет JS-код и ждать тут чего-либо бессмысленно.

Answer 1 · 2019-11-15 21:52:06

Вам правильно написали в комментарии, что ждать тут бесполезно - скрапи не будет исполнять js.
По коду - зачем вам таймер из threading, кажется для вашей задачи досточно sleep(5). Но это все равно не поможет, если у вас хтмл изменяется jsом после загрузки - вам нужен селениум.

Куда вставить таймер Python чтобы работало?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт