n1k_crimea
@n1k_crimea
26 лет Крым

Как на Python определить, что текст на изображении не горизонтален и изображение необходимо повернуть?

Есть pdf документы (сканы документов бумажных), конвертирую каждый лист в изображение и распознаю с помощью pytesseract. Но проблема в том, что некоторые листы в pdf имеют вертикальную ориентацию. Необходимо определять какие изображения нужно повернуть на 90грд.
Какая библиотека в этом поможет?
  • Вопрос задан
  • 59 просмотров
Пригласить эксперта
Ответы на вопрос 1
n1k_crimea
@n1k_crimea Автор вопроса
26 лет Крым
Собственно, решение такое.
В pytesseract есть метод image_to_osd, возвращает строку:
Page number: 0
Orientation in degrees: 90
Rotate: 270
Orientation confidence: 23.51
Script: Cyrillic
Script confidence: 10.63
есть еще EXIF - в этой статье хорошо описано https://habr.com/ru/post/471112/, но мне не подходит из-за того что работаю с конвертированным изображением
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы