Как правильно считать файл вместе с hidden __csrf_token?

Question

cegthgtlhj @cegthgtlhj

Как правильно считать файл вместе с hidden __csrf_token?

пытаюсь написать автоматический вход на сайт с дальнейшим парсингом результатов.
Авторизационная форма кроме логина и пароля пересылает hidden __csrf_token.

Вопрос 1
Правильно ли что сначала нужно этот вебсайт считать GET запросом, потом вытащить из HTML текста __csrf_token и его вместе с логином и паролем отправить следующим запросом для входа на сайт?
если неправильно, то как сделать?

Вопрос 2
Предполагая, что моя логика в Вопросе 1 правильная, пытаюсь нижеуказанным кодом считать сайт.

import requests
from bs4 import BeautifulSoup
s = requests.Session()
_url_00 = "https://www.filter-technik.de/account"
x_00 = s.get(_url_00)
with open("_ELSAESSER_000.html", "w", encoding='utf-8') as f:
    f.write(x_00.text)
soup_00 = BeautifulSoup(x_00.text, "html.parser")
_match = soup_00.find("__csrf_token")
print(_match)
input()

как оказывается, при считывании таким способом, __csrf_token в тексте файла не сохраняется

хотя при сохранении в мозилле файла типа Ctrl+S, этот токен там виден

Как правильно считать файл вместе с hidden __csrf_token??

Вопрос задан более трёх лет назад
94 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 135 просмотров
2

ответа
PHP

+1 ещё

Простой
Как получить данные title на TradingView?
- 1 подписчик
- 17 апр.
- 31 просмотр
1

ответ
Парсинг

Средний
Как парсить сайты на Wordpress в определённой доменной зоне?
- 1 подписчик
- 16 апр.
- 23 просмотра
3

ответа
Python

+1 ещё

Простой
Как вывести конкретное значение из класса в python?
- 1 подписчик
- 14 апр.
- 120 просмотров
1

ответ
Парсинг

Простой
Есть кто copart.com парсил?
- 1 подписчик
- 14 апр.
- 104 просмотра
0

ответов
Python

+1 ещё

Средний
Почему ответ из request, появляется только после того как зашёл сайт, с которого и пытаемся получить ответ через запрос, а так он пуст?
- 1 подписчик
- 13 апр.
- 101 просмотр
3

ответа
Парсинг

Простой
Как парсить сайт с авторизацией?
- 2 подписчика
- 11 апр.
- 617 просмотров
1

ответ
Python

+1 ещё

Простой
Массовае скачивание файлов с сайта?
- 1 подписчик
- 10 апр.
- 120 просмотров
3

ответа
Python

+1 ещё

Простой
Создание папки с помощью Python по названию блока из HTML?
- 1 подписчик
- 10 апр.
- 58 просмотров
0

ответов
Парсинг

+1 ещё

Средний
Как исправить ошибку кодировки Powershell, при выводе InvokeRequest?
- 1 подписчик
- 10 апр.
- 97 просмотров
1

ответ
Показать ещё Загружается…

Веб-разработка и управление IT в Sortage

Sortage • Москва

от 180 000 ₽

Ведущий системный администратор

U-System • Воронеж

от 120 000 ₽

Python Backend Разработчик

Stakewolle

от 35 000 до 45 000 ₽

Нужен директолог с опытом работы

19 апр. 2024, в 10:02

6000 руб./за проект

Помощь с парсингом XML файла яндекс товаров

19 апр. 2024, в 09:46

500 руб./за проект

Обработать массив фотографий

19 апр. 2024, в 08:46

5000 руб./за проект

Если в инспекторе видно, что браузер добавляет к запросам __csrf_token, то логика верна, но нужно смотреть откуда именно подгружается токен, вполне возможно, что его нет в тексте html-страницы.

Answer 1 · 2019-10-18 20:23:32

Собственно после минуты в инспекторе оказалось, что токен отдаётся в заголовке ответа.

r = requests.get('https://www.filter-technik.de/csrftoken')
token = r.headers['X-Csrf-Token']

Answer 2 · 2019-10-18 20:50:58

AWEme AWEme
Благодарю вас. Для Вас это одна минута, для меня-чайника несколько дней.
Всё расно не совсем понял как вы пришли к этим двум строкам
"https://www.filter-technik.de/csrftoken"
и
'X-Csrf-Token'
Если найдете еще минуту, поясните пож-ста вкратце.

Как правильно считать файл вместе с hidden __csrf_token?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт