Как авторизоваться при помощи requests на PHP форуме?

Question

DarkWood @DarkWood

Как авторизоваться при помощи requests на PHP форуме?

Здравствуйте.

Хочу для автоматизации определенных задач распарсить форум demiart.ru. Для просмотра тем там требуется авторизация. Логин и пароль у меня, конечно, есть. Пробую авторизоваться по этому уроку: https://kazuar.github.io/scraping-tutorial/

Собственно, мой код взят оттуда с минимальными изменениями:

import requests
from lxml import html

LOGIN_URL = "http://demiart.ru/forum/index.php?"
URL = "http://demiart.ru/forum/index.php?showtopic=8436"

session_requests = requests.session()

payload = {
    "UserName": USERNAME, 
    "PassWord": PASSWORD, 
    "submit": 'Войти',
}

result = session_requests.post(LOGIN_URL, data=payload, headers=dict(referer=LOGIN_URL))

result = session_requests.get(URL, headers=dict(referer=URL))
tree = html.fromstring(result.content)
theme_title = tree.xpath(".//div[@class='f_break tablefixed']")

print(theme_title)

Форум не имеет явной страницы логина - это можно сделать где угодно, потому указал в качестве таковой главную. csrf_token, упоминаемый в уроке, здесь отсутствует. Для примера хочу вытащить хотя бы название любой темы (xpath уже проверен).

В ответ получаю прежнюю страницу без авторизации. По сути у меня даже дерево элементов не получается (распечатываю tree и вижу только <Element html at 0x3b3a188>).

В сём деле совсем новичок. Возможно, нужно больше данных (например, куки)? Или нужно это как-то иначе делать?

Вопрос задан более трёх лет назад
252 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 25 минут назад
- 7 просмотров
0

ответов
Парсинг

+1 ещё

Средний
Как правильно написать функцию IMPORTJSON для парсинга цен криптовалют в гугл таблицу?
- 1 подписчик
- час назад
- 8 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 12 часов назад
- 83 просмотра
0

ответов
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 14 часов назад
- 61 просмотр
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- 19 часов назад
- 41 просмотр
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- 22 часа назад
- 90 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 136 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 230 просмотров
3

ответа
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 136 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить данные title на TradingView?
- 1 подписчик
- 17 апр.
- 31 просмотр
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Доработать сайт на React + Nest

19 апр. 2024, в 12:05

1500 руб./в час

Разработать программу в CodeSys

19 апр. 2024, в 12:00

250 руб./за проект

Сделать мобильную версию сайта Next.js/React

19 апр. 2024, в 11:54

500 руб./в час

Answer 1 · 2017-03-18 11:25:06

1) используй pycurl и только pycurl - быстрее, проще, мультипоточно
2) используй www.telerik.com/fiddler для заголовков и понимания что передается

думаю, в твоем случае достаточно указать сохранение кук и все получится, но - см. п1

Как авторизоваться при помощи requests на PHP форуме?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт