Распознавание русского текста с отсканированных изображений, как реализовать?

Question

funkynick89 @funkynick89

Распознавание русского текста с отсканированных изображений, как реализовать?

Есть задача, распознать русский текст с отсканированных изображений/документов (*.jpg или *.pdf) и потом занести эти данные в базу.
Вопрос в следующем, кто имел опыт подобной разработки и какими средствами это лучше реализовать?

P.S. если есть библиотеки подобные под PHP, то это преимущественное решение для меня, как начинающего )
Заранее спасибо за консультации и ответы!

Вопрос задан более трёх лет назад
1359 просмотров

Комментировать

Подписаться 5 Оценить Комментировать

Решения вопроса 1

5 комментариев

aol-nnov @aol-nnov

Пользователь: любезный, вы его пробовали скомпилировать самостоятельно? А байндинги к чему-нить там существуют в природе?
Я вот этими глазами (показывает коробочку с парой поврежденных глаз) лицезрел исходники его, а еще был какой-то интузиаст, то ли француз, то ли немец, который брался рефакторить ту гору кода, который авторы cuneiform-а "заопенсорсили", так он быстро сдулся, увы.
И результаты у него были неутешительные. Вот така печаль.

Написано более трёх лет назад
Everything_is_not_so_bad @2ord

https://github.com/thiagoalessio/tesseract-ocr-for-php

Написано более трёх лет назад
aol-nnov @aol-nnov

> cuneiform превзошел даже ABBYY FineReader Engine
может быть. но cuneiform - куча неподдерживаемого кода, в котором что-то поменять - нереально.
все алгоритмы написаны "как на фортране" и никаких комментариев.
да, как "работающий монолит", он, наверное сойдет, но развивать и встроить его себе - дохлый номер.
к тому же, вопрос байдингов для него пока остается открытым - никто ничего не предложил еще (в отличие от тессеракта.

К тому же, его, емнип, можно обучать, если уж приспичит сильно научить хорошо распознавать...

Написано более трёх лет назад
AVKor @AVKor

aol-nnov: А зачем его самостоятельно компилировать, если он есть в пакетах (в Debian есть, по крайней мере).

Написано более трёх лет назад
funkynick89 @funkynick89 Автор вопроса

в итоге решил что все-таки проще будет реализовать подобную утилиту средствами Python, пошел изучать tutorial )

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+4 ещё

Простой
Aiogram, ERROR Yellow code, aiogram.types.web_app_info not imported?
- 1 подписчик
- час назад
- 33 просмотра
1

ответ
Python

+1 ещё

Простой
Бот не реагирует на заданные команды?
- 1 подписчик
- 3 часа назад
- 28 просмотров
0

ответов
Python

Простой
Сохраняется ли куда-то скриншот в Pyautogui?
- 1 подписчик
- 3 часа назад
- 23 просмотра
1

ответ
Java

Простой
Как сделать глобальный чат Chatty?
- 1 подписчик
- 9 часов назад
- 36 просмотров
0

ответов
Python

+2 ещё

Простой
Как получить список приглосительных ссылок в телеграм канале?
- 1 подписчик
- 11 часов назад
- 18 просмотров
0

ответов
Linux

+4 ещё

Простой
Как исправить ошибку при установке pam_sqlite?
- 1 подписчик
- 11 часов назад
- 26 просмотров
1

ответ
Python

Простой
Пишу Todolist появилась ошибка, как исправить?
- 1 подписчик
- 13 часов назад
- 37 просмотров
1

ответ
Java

+2 ещё

Простой
Selenide + Spring Boot. Как объявить страницу через метод open(), если класс страницы является bean?
- 1 подписчик
- 14 часов назад
- 17 просмотров
0

ответов
Python

+1 ещё

Простой
Как решить проблему с терминалом PyCharm?
- 1 подписчик
- 14 часов назад
- 41 просмотр
0

ответов
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 15 часов назад
- 17 просмотров
0

ответов
Показать ещё Загружается…

PHP разработчик

Ведисофт • Екатеринбург

от 25 000 ₽

PHP Developer

YCLIENTS • Москва

от 200 000 до 350 000 ₽

PHP-разработчик

FunPay

от 300 000 до 500 000 ₽

Скопировать верстку, посадить на функционал

20 апр. 2024, в 12:01

20000 руб./за проект

Разработать сайт-визитку на Wordpress

20 апр. 2024, в 11:52

5000 руб./за проект

Написать программу иммитирующую поведение человека для выбора услуг

20 апр. 2024, в 11:21

1000 руб./за проект

Answer 1 · 2015-09-15 17:29:28

tesseract есть от гугла, cuneiform там.. (хотя, последний я уже не знаю, как советовать. кажется, он давно протух)
сходу нашел байндинги к питону и джаве.

Answer 2 · 2015-09-15 17:29:45

Это точно делается никак не на php потому что операция ресурсозатратная php для этого слишком медленный.

Распознавание русского текста с отсканированных изображений, как реализовать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт