Как достать данные из изображения документа(паспорт, права..)?

Question

IceJOKER @IceJOKER

Web/Android developer

Как достать данные из изображения документа(паспорт, права..)?

Здравствуйте, собственно вопрос в заголовке, есть изображения документов, нужно оттуда вытащить данные(ФИО, дата рождения и так далее).
Для себя нашел два варианта:
1. Просто image => text конвертация и регулярками выдергивать нужные данные, но к сожалению https://github.com/tesseract-ocr/tesseract плохо справляется с русскими символами, какую библиотеку можно использовать, которая хорошо справится с русским текстом?
2. Более сложный подход: feature extraction (выдернуть из изображения нужную часть, где находится документ) и научить нейросеть находить нужные области и выдергивать текст оттуда. Ранее не сталкивался с подобным, поэтому есть только поверхностные знания.

Буду рад любым предложениям - библиотеки, статьи, проекты.

p.s. рассматриваю только бесплатный вариант

Вопрос задан более трёх лет назад
3791 просмотр

1 комментарий

Подписаться 2 Простой 1 комментарий

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

C#

+1 ещё

Простой
Как лучше реализовать обновление данных о процессах, используя winforms c#?
- 1 подписчик
- час назад
- 22 просмотра
0

ответов
C#

+1 ещё

Средний
Отклик при соприкосновении с коллайдером 2D?
- 1 подписчик
- 6 часов назад
- 13 просмотров
1

ответ
C#

+1 ещё

Простой
Почему коллайдеры деревьев на террайне съезжают?
- 1 подписчик
- 7 часов назад
- 18 просмотров
1

ответ
C#

+1 ещё

Простой
Почему выводится type mismatch при загрузке файла анимации в юнити?
- 1 подписчик
- 12 часов назад
- 60 просмотров
1

ответ
C#

+2 ещё

Простой
Как правильно обучаться в начале пути?
- 1 подписчик
- 13 часов назад
- 106 просмотров
1

ответ
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- 14 часов назад
- 82 просмотра
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- 14 часов назад
- 53 просмотра
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- вчера
- 173 просмотра
1

ответ
C#

+2 ещё

Простой
Почему получается подключить Core в Dockerfile?
- 3 подписчика
- вчера
- 659 просмотров
3

ответа
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- вчера
- 135 просмотров
2

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Модель управления электродвигателем в Matlab, Simulink

24 апр. 2024, в 06:52

5000 руб./за проект

Анимация логотипа

24 апр. 2024, в 00:08

20000 руб./за проект

Разработка дизайна раздела «Статьи» на сайте «Мир отходов»

23 апр. 2024, в 23:01

10000 руб./за проект

на хабре кто то пиарился.. чуть ли не облачное решение.. паспорты РФ точно там были.. но за 15 минут не смог сформулировать удачный запрос

скажем так ABBYY уж точно не единственное решение, и если порыться на хабре, возможно удастся найти вариант бесплатного старта.. если это имеет значение

Answer 1 · 2019-03-01 12:49:48

longclaps @longclaps

PassportReader

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-03-01 14:43:45

Владислав Лысков @Vlatqa

https://pypi.org/project/PassportEye/

Ответ написан более трёх лет назад

Комментировать

Как достать данные из изображения документа(паспорт, права..)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт