@pcdesign

Как в тексте оставить ссылки вида href='#id' и удалить остальные?

Например, текст:
<p>Lorem Ipsum is simply dummy text of the printing and <a href="/ggg">typesetting</a> industry.
Lorem Ipsum has been the industry's standard <a href="#id">dummy</a> text ever since the 1500s, when an
unknown printer took a galley of type and scrambled it to make a type specimen book.</p>

<p>It has survived not only five centuries, but also
 the <a href="http://example.com">leap</a> into electronic typesetting...</p>


Ожидаемый результат:

<p>Lorem Ipsum is simply dummy text of the printing and typesetting industry.
Lorem Ipsum has been the industry's standard <a href="#id">dummy</a> text ever since the 1500s, when an
unknown printer took a galley of type and scrambled it to make a type specimen book.</p>

<p>It has survived not only five centuries, but also the leap into electronic typesetting...</p>


Может есть какой-нибудь модуль, который бы умел это делать?
  • Вопрос задан
  • 80 просмотров
Решения вопроса 1
@pcdesign Автор вопроса
from bs4 import BeautifulSoup 
soup = BeautifulSoup(html, features="lxml")
for m in soup.find_all('a'):
    if 'href="#' not in str(m):
        m.replaceWithChildren()
print(soup)
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
netpastor
@netpastor
Python developer
import re
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
ZClick Москва
от 50 000 до 100 000 руб.
Protoplan Краснодар
от 80 000 до 150 000 руб.
22 июл. 2019, в 18:33
200 руб./за проект
22 июл. 2019, в 18:28
10000 руб./за проект