r4khic
@r4khic
Начинающий кодер на python

Как убрать спарщенные лишние данные python?

Всем привет ! У меня такой вопрос,как сделать срез спарщенных данных?
Я парсю даты 10 новостных ресурсов,и вот при парсенге одного из ресурсов у меня траблы.

Когда я парсю дату этого ресурса Дата при парсинге выходят таким образом:
5d5f6c666e5db191152393.png
Как лучше реализовать чтобы дата была такая:23 Августа 2019 10:25
Код:
# < Собираем даты с страниц.
def get_item_datetime(item_page,datetime_rule,datetime1_rule):
    soup = BeautifulSoup(item_page, 'lxml')
    item_datetime = soup.find(datetime_rule[0],{datetime_rule[1]:datetime_rule[2]})
    if item_datetime is not None:
        item_datetime = soup.find(datetime_rule[0],{datetime_rule[1]:datetime_rule[2]}).text
        print(item_datetime)
        #item_datetime = dateparser.parse(item_date, date_formats=['%d %B %Y %H'])
    else:
        if (len(datetime1_rule) == 3):
            item_datetime = soup.find(datetime1_rule[0],{datetime1_rule[1]:datetime1_rule[2]})
            item_datetime = dateparser.parse(item_datetime, date_formats=['%d %B %Y %H'])
        else:
            item_datetime = ''
    return item_datetime
  • Вопрос задан
  • 120 просмотров
Пригласить эксперта
Ответы на вопрос 1
FeNUMe
@FeNUMe
Используйте decompose(), чтобы убрать вложенный span с количеством просмотров из div с датой.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы