Как прочитать html файл в Python?

f = open (filename , 'r')
result = f.read()
print(result)

Результат
Traceback (most recent call last):
  File "file.py", line 10, in <module>
   result = f.read()
  File "C:\Python34\lib\encodings\cp1251.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 10419: ch
aracter maps to <undefined>

Подскажите как правильно прочитать файл? Уже всю голову сломал.
  • Вопрос задан
  • 11032 просмотра
Пригласить эксперта
Ответы на вопрос 3
suguby
@suguby
программист, python, django, mysql, git, hg, linux
видно что происходит попытка перекодировать из любимой винодовой cp1251 :) а файл видать в UTF8...
попробуй открыть как 'rb' и конвертировать построчно
f = open (filemane , 'rb')
for line in f:
     print(line.decode('utf8'))

а вообще хорошо бы знать, в какой кодировке файл.
Ответ написан
@Alex_Korj
я решил проблему путем преобразования файлов в utf-8 -- ANSI
Ответ написан
Комментировать
ArthurG
@ArthurG
Попробуйте в начале *.py файла добавить:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы