@bugagashnik

Парсинг сайта выдает текст кириллицы в формате '\u0410', как преобразовать в кириллицу?

Вытащил элемент(текст), в консоле выдает в формате '\u0410 \u0443 \u043c\u0435\u043d\u044f \u0449\u0430\u0441 \u0432\u043e\u0442 \u0442\u0430\u043a\u043e\u0435 \u0447\u043c\u043e \u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u0434 \u043e\u043a\u043d\u0430\u043c\u0438!'. Как преобразовать в кириллицу? И какой это формат?
  • Вопрос задан
  • 1980 просмотров
Решения вопроса 1
@Andy_U
Вот такой код на Python 3.6:
s = r'\u0410 \u0443 \u043c\u0435\u043d\u044f \u0449\u0430\u0441 \u0432\u043e\u0442 \u0442\u0430\u043a\u043e\u0435 \u0447\u043c\u043e \u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u0434 \u043e\u043a\u043d\u0430\u043c\u0438!'
print(s.encode('ascii').decode('unicode_escape'))

Выводит в консоль:
А у меня щас вот такое чмо стоит под окнами!

Только у вас ошибка раньше - вы где-то байтовое сообщение зря декодировали в 'ascii', а нужно было в ту кодировку, что в заголовке страницы.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы