@KOLAMBA97

Как разобраться в структурк текстового файла на уровне кодировки?

Доброго времени суток
Необходимо написать программу, которая бы переводила текстовый файл из кодировки MS-DOS CP866 в кодировку Windows-1251.
Нигде не могу найти информацию как устроен текстовый файл на уровне кодировки и как считывать закодированные символы, есть только таблицы кодировок.
Написал программу, которой код одного символа записываю в бинарный файл, при открытии этого файла в текстовом редакторе ничего вразумительного не получаю.
2c46c825893a44d48c25652be7bbb4ff.png

код программы:

#include
#include
#include
#include
using namespace std;
int main(void)
{
int x=0, y=412;
ofstream out("1.bin",ios::binary|ios::out);
out.write((char*)&y,sizeof y);
out.close();
return 0;
}

Как можно извлечь коды символов из текстового файла?
  • Вопрос задан
  • 273 просмотра
Пригласить эксперта
Ответы на вопрос 1
"Нигде не могу найти информацию как устроен текстовый файл на уровне кодировки и как считывать закодированные символы, есть только таблицы кодировок."
А никак. Кодировка по отношению к текстовому файлу - сущность внешняя.
Но можно считать контент побайтово и применить к нему преобразование кодировки.

"Как можно извлечь коды символов из текстового файла?"
Ну так N считанных байт и будет предоставлять код 1 символа для N-байтной кодировки кодировки.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы