gadzhi15
@gadzhi15

Кодировка csv файла. Как сменить?

Есть csv файл в кодировке windows-1251. В Python использую библиотеку pandas для работы с этим файлом. Возникают проблемы при удалении символов кириллицы. Как сменить кодировку средствами Python на utf-8?
  • Вопрос задан
  • 4191 просмотр
Решения вопроса 1
@polar_winter
Офтоп в Linux - man iconv
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
sim3x
@sim3x
In [1]: with open('/tmp/1', 'w+', encoding='cp1251') as f: f.write('qwertyйцукен')

In [2]: cat /tmp/1
qwerty������
In [3]: with open('/tmp/1', 'r', encoding='cp1251') as f: print(f.read())
qwertyйцукен

In [4]: with open('/tmp/1', 'r', encoding='cp1251') as f: 
   ...:     with open('/tmp/2', 'w+', encoding='utf-8') as o: o.write(str(f.read()))
   ...:     

In [5]: cat /tmp/2
qwertyйцукен
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы