Алгоритм определения прямоугольной области, содержащей слово, на изображении?

Question

KvanTTT @KvanTTT

Алгоритм определения прямоугольной области, содержащей слово, на изображении?

Подскажите пожалуйста универсальный, стабильный, не очень сложный алгоритм для поиска ближайшей прямоугольной области, содержащей слово, на изображении от заданной точки.

Входными данными является точка X, Y (на рисунке отмечена красным крестиком).
Выходными данными является прямоугольник Left, Top, Width, Height (на рисунке отмечен голубым цветом).

Универсальность подразумевает под собой работу с любыми размерами, цветами шрифтов и как можно большим количеством типов шрифтов.

На данный момент реализован алгоритм, идея которого заключается в подсчете светлых пикселей в столбцах и строках несколько раз. Но он нуждается в доработке и подборке коэффициентов.

У кого-нибудь есть другие идеи? Как сегментация слов и картинок реализована в OCR движках?

Вопрос задан более трёх лет назад
3800 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Распознавание текста

Средний
Существует бесплатная OCR-программа с поддержкой якутского языка?
- 2 подписчика
- 02 апр.
- 190 просмотров
1

ответ
Python

+3 ещё

Средний
Какие существуют библиотеки Python для комплексной обработки текста, включая исправление ошибок и удаление лишних символов?
- 1 подписчик
- 01 апр.
- 83 просмотра
1

ответ
Linux

+3 ещё

Простой
Чем распознать текст на картинках в PDF?
- 1 подписчик
- 30 мар.
- 235 просмотров
1

ответ
Автоматизация обработки текста

+1 ещё

Сложный
Кто знает user-friendly инструмент для поиска по файлам с помощью языковых моделей (RAG)?
- 3 подписчика
- 11 мар.
- 122 просмотра
2

ответа
Автоматизация обработки текста

Простой
Как автоматизировать заполнение бланка docx, меняя лишь часть текста?
- 1 подписчик
- 29 февр.
- 41 просмотр
1

ответ
PDF

+1 ещё

Средний
Как выполнить конвертацию пдф изображений в текст?
- 1 подписчик
- 25 февр.
- 110 просмотров
1

ответ
Автоматизация обработки текста

Простой
Как быстро менять ссылки Django?
- 1 подписчик
- 20 февр.
- 34 просмотра
1

ответ
Python

+2 ещё

Средний
Обучение нейросети по распознаванию рукописного текста на русском. Как повысить loss при обучении?
- 2 подписчика
- 22 янв.
- 145 просмотров
0

ответов
Python

+3 ещё

Простой
Почему tesserat не распознает цифры? Зачеркнутый текст?
- 1 подписчик
- 08 янв.
- 94 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Как можно автоматически поменять гендер действующего лица в тексте?
- 1 подписчик
- 01 янв.
- 50 просмотров
0

ответов
Показать ещё Загружается…

IT HR менеджер

Bright Mobile Apps

До 1 700 $

Рекрутер

IGA Technologies • Москва

До 70 000 ₽

IT recruiter (проектная работа)

SmartMerch

от 30 000 ₽

Привязка к Маркетплейсам 1С Розница 2.3

20 апр. 2024, в 05:26

10000 руб./за проект

Дописать функцию на Flutter, работа с yandex map kit

20 апр. 2024, в 04:18

3000 руб./за проект

Английская версия для сайта на WordPress

20 апр. 2024, в 03:34

8000 руб./за проект

Answer 1 · 2012-01-21 21:26:53

Тут надо решить много задач:
Определить где текст (блоки текста), правильно повернуть его, определить, был ли клик внутри этой области.
Потом слова можно выделить, используя Connected-component labeling ( en.wikipedia.org/wiki/Connected_Component_Labeling ) наверное.
Вообще, есть же бесплатные OCR библиотеки, они это точно все должны уметь делать.

Answer 2 · 2012-01-21 20:29:12

Примерно так:
— Сначала обесцвечиваем и уменьшаем количество цветов до 2 (чёрный и белый);
— Идём в одном направлении (верх, вниз, влево или вправо) и ищем 1-2 полностью белых строки. Записываем координаты внутренней;
— Повторяем для всех направлений;
— Получаем область ограниченную внутренними координатами;
— Повторяем для неё;
— Дальше уже идёт разбивка на буквы.

Алгоритм определения прямоугольной области, содержащей слово, на изображении?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт