@razum_04

Как реализовать парсинг многострочного текста с BeautifulSoup?

Здравствуйте, решил попрактиковаться в парсерах и выбрал bash.im. Там цитаты в несколько строк и разделены тегом
, однако в итоге получаю это 5d55e1d3a8d86155515183.png
Как правильно спарсить чтобы оставить все переносы строк?
Вот код функции парсера
def parse(html):
	soup = BeautifulSoup(html, 'html5lib')
	quotes = soup.find(class_="quotes")
	articles = soup.findAll('article', class_='quote')
	for article in articles:
		header_permalink = article.find('a', class_='quote__header_permalink')
		quotes_list.update({
			int(header_permalink.text[1:]): {
				'text': str(article.find('div', class_='quote__body').text),
				'votes': article.find('div', class_='quote__total').text
			}
		})
  • Вопрос задан
  • 40 просмотров
Пригласить эксперта
Ответы на вопрос 1
@tumbler
бекенд-разработчик на python
5d56404366181384141227.png
Там <br/> внутри, их тоже надо учитывать. Как вариант, использовать innerHtml и заменять <br/> на переносы строк.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
21 авг. 2019, в 18:58
100 руб./за проект
21 авг. 2019, в 18:32
5000 руб./за проект
21 авг. 2019, в 18:21
1000 руб./за проект