Распознавание русского текста с отсканированных изображений, как реализовать?

Есть задача, распознать русский текст с отсканированных изображений/документов (*.jpg или *.pdf) и потом занести эти данные в базу.
Вопрос в следующем, кто имел опыт подобной разработки и какими средствами это лучше реализовать?

P.S. если есть библиотеки подобные под PHP, то это преимущественное решение для меня, как начинающего )
Заранее спасибо за консультации и ответы!
  • Вопрос задан
  • 1359 просмотров
Решения вопроса 1
@aol-nnov
tesseract есть от гугла, cuneiform там.. (хотя, последний я уже не знаю, как советовать. кажется, он давно протух)
сходу нашел байндинги к питону и джаве.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
Это точно делается никак не на php потому что операция ресурсозатратная php для этого слишком медленный.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы