Как красиво подсчитать слова на сайте?

Question

Антон @TonyTrueTony

Python

Как красиво подсчитать слова на сайте?

Задался целью подсчитать количество определенных слов на сайте.
Накидал код

import requests
from bs4 import BeautifulSoup
import re


word = 'Pitton'
url = 'https://en.wikipedia.org/wiki/Joseph_Pitton_de_Tournefort'
count = 0

r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
# убираю теги html
w = re.sub(r'<[^>]+>', '', str(soup))
# отделяю не буквы от слов для корректного сплита
w = re.sub(r'\W', ' ', w)

for i in w.split():
    if i.lower() == word.lower():
        count += 1

print(count)

Но такой код не учитывает текст, который остался в script
Конечно можно было бы написать еще одно регулярное выражение, но может есть библиотека, которая сама уберёт всё лишнее из html и превратить его в красивую строку?

Вопрос задан более трёх лет назад
441 просмотр

Комментировать

Подписаться 2 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Как исправить ошибку?
- 1 подписчик
- час назад
- 31 просмотр
1

ответ
Python

Простой
Что не так с кодом Python?
- 1 подписчик
- 13 часов назад
- 118 просмотров
1

ответ
Python

+1 ещё

Простой
Как локализовать label в декораторе button ui?
- 1 подписчик
- 14 часов назад
- 22 просмотра
1

ответ
Python

Простой
В функции four_squares программа выдает ошибку как только обращается, и почему не проходит тест с этим числом 106369249365575352836589875696130383747?
- 1 подписчик
- 16 часов назад
- 87 просмотров
2

ответа
Python

+1 ещё

Простой
Возможно ли соединить работающий java код и так же работающий скрипт python?
- 1 подписчик
- вчера
- 160 просмотров
3

ответа
Python

+2 ещё

Простой
Почему не работает callback в Телеграм боте?
- 1 подписчик
- вчера
- 78 просмотров
0

ответов
Python

+1 ещё

Простой
Как вывести конкретное значение из класса в python?
- 1 подписчик
- вчера
- 105 просмотров
1

ответ
Python

Простой
Где на постоянке запустить python скрипт?
- 1 подписчик
- 13 апр.
- 169 просмотров
1

ответ
Python

+1 ещё

Простой
Как щелкнуть на show Full Screen video с помощью Selenium?
- 1 подписчик
- 13 апр.
- 38 просмотров
0

ответов
Python

+1 ещё

Простой
Как оптимизировать запрос?
- 1 подписчик
- 13 апр.
- 118 просмотров
2

ответа
Показать ещё Загружается…

Python разработчик

Smart Seller

от 150 000 до 250 000 ₽

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Нужен кто сделает трафик в Тик Ток

16 апр. 2024, в 10:47

80000 руб./за проект

Сделать работу на R studio

16 апр. 2024, в 10:41

1000 руб./за проект

Написание проекта на микроконтроллер

16 апр. 2024, в 10:39

2000 руб./за проект

Answer 1 · 2018-07-19 14:30:25

Есть такое, передведёт html в текст

html2text

А ещё люди делают так:

for script in soup(["script", "style"]):
    script.extract()
text = soup.get_text()

Как красиво подсчитать слова на сайте?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт