Задать вопрос

activebomb @activebomb

python

Как спарсить ссылку если есть data-ipb="noparse"?

import requests
from bs4 import BeautifulSoup as bs

headers = {'accept': '*/*',
           'user-agent': 'Mozilla/5.0 (Linux; U; Android 4.0.2; en-us; Galaxy Nexus Build/ICL53F) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30'}
base_url = 'https://www.biznet.ru/topic305118.html/page-2#entry2183295'

def bf_parse(base_url, headers):
    session = requests.session()
    request = session.get(base_url, headers=headers)
    if request.status_code == 200:
        soup = bs(request.content, 'html.parser')
        div = soup.find_all('div', attrs={'class': "topic_reply"})
        print(div)
        
bf_parse(base_url, headers)

Пробовал (d.find('a') for d in soup.find_all('div', attrs={'class': "topic_reply"})), не получилось, нужно забрать все ссылки (href), которые находятся примерно тут (почему-то я грешу на то, что у меня ничего не получается из-за строки data-ipb="no-parse".

Вопрос задан более трёх лет назад
108 просмотров

2 комментария

Подписаться 2 Простой 2 комментария

Ivan Yakushenko @kshnkvn
А в чем проблема забрать просто сразу все ссылки? Примерно так:
links = [link.get('href') for link in soup.find_all('a', title='Просмотр профиля')]
Написано более трёх лет назад
activebomb @activebomb Автор вопроса

Ivan Yakushenko, спасибо помогло, не думал что это сработает, думла будет парсить ввиде текста

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Сложный
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 30 минут назад
- 4 просмотра
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- час назад
- 24 просмотра
0

ответов
Парсинг

+1 ещё

Средний
Как правильно написать функцию IMPORTJSON для парсинга цен криптовалют в гугл таблицу?
- 1 подписчик
- 2 часа назад
- 8 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 13 часов назад
- 92 просмотра
0

ответов
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 15 часов назад
- 65 просмотров
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- 21 час назад
- 42 просмотра
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- 23 часа назад
- 96 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 137 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 231 просмотр
3

ответа
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 17 апр.
- 137 просмотров
2

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Софт на js

19 апр. 2024, в 13:31

10000 руб./за проект

Разработка Pwa сайта

19 апр. 2024, в 13:12

35000 руб./за проект

Доработать вебпроект со стеком: yii2, jquery, vue

19 апр. 2024, в 13:06

6000 руб./за проект