Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Question

Propieller @Propieller

PDF

Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Есть желание заиметь систему хранения/работы с документацией.
Сейчас документация - свалка из сотен Гб сканированных в PDF документов по разным каталогам. К некоторым документам в этих же каталогах есть файлы сканов изменившихся в ходе проектирования/эксплуатации страниц документа. Корневой уровень - по системам/подсистемам/задачам при проектировании. В названии каталога или файлов может присутствовать текстовое описание о том, что внутри. Обычно же название файлов и каталогов что-то вроде kakoy-to-tekst-XYYZ-esche-tekst, причем XYYZ - код данного документа, по которому его можно найти по ссылкам в каких-то других документах. Внутри - PID-диаграммы, схемы подключения, алгоритмы, текстовые описания. Иногда вместе с документом хранится скан сопроводительного письма с перечнем переданных документов. Таким образом, чтобы найти инфу о подключении или алгоритме какого-то устройства - примерно прикидываешь к какому куску проекта оно относится и начинаешь просматривать там всё подряд, пока не найдешь отсылку на необходимое.

Как решение - наверно это будет какая-то разновидность PDM (Product Data Management).
Надо:
- по всем файлам свалки - распознать и сложить слоем в pdf текстовые данные (для осуществления возможности текстового поиска)
- вести в интранет базу с соответствием Barcode <-> пачка соответствующих документов, чтобы сфоткав с телефона Barcode можно было быстро найти и посмотреть соответствующие документы с телефона (интранет wifi) или любого интранет компа
- иметь возможность посмотреть как актуальную версию документа, так и любую из истории изменений
- open source (1. потому что проблемы негров кошелька руководства не касаются, 2. потому что скорее всего придется допиливать под себя)

Вопрос задан более трёх лет назад
420 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

JavaScript

+2 ещё

Простой
Как скачать pdf из встроенного просмотрщика на сайте?
- 1 подписчик
- 24 апр.
- 155 просмотров
1

ответ
Браузеры

+1 ещё

Простой
Что делать, если не открываются pdf файлы в браузерах?
- 1 подписчик
- 15 апр.
- 124 просмотра
1

ответ
Linux

+3 ещё

Простой
Чем распознать текст на картинках в PDF?
- 1 подписчик
- 30 мар.
- 252 просмотра
1

ответ
JavaScript

+2 ещё

Средний
Как скачать защищенный от скачивания PDF-файл с сайта?
- 5 подписчиков
- 11 мар.
- 1625 просмотров
2

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как уменьшить размер PDF на сервере?
- 1 подписчик
- 01 мар.
- 92 просмотра
3

ответа
PDF

+1 ещё

Средний
Как выполнить конвертацию пдф изображений в текст?
- 1 подписчик
- 25 февр.
- 111 просмотров
1

ответ
PDF

+1 ещё

Простой
Как печать PDF из Microsoft EDGE с авто выбором источника бумаги под размер страницы?
- 1 подписчик
- 15 февр.
- 96 просмотров
1

ответ
PHP

+2 ещё

Сложный
Как можно убрать отступ в PDF созданный чрез DomPDF, язык PHP?
- 1 подписчик
- 11 февр.
- 155 просмотров
1

ответ
PHP

+2 ещё

Простой
Если ли PHP-библиотека для конвертации HTML c CSS Grid в PDF?
- 1 подписчик
- 07 февр.
- 122 просмотра
2

ответа
CSS

+2 ещё

Простой
Как убрать цветные полосы в pdf версии html файла?
- 1 подписчик
- 24 дек. 2023
- 78 просмотров
0

ответов
Показать ещё Загружается…

Продакт дизайнер в финтех

Module Agency

от 110 000 до 190 000 ₽

Golang developer middle

Posman

До 200 000 ₽

PPC Team Lead Amazon (Senior)

GORA Group

от 2 500 $

Необходимо сверстать приложение согласно макету Figma используя React

26 апр. 2024, в 22:22

1500 руб./за проект

Написать модуль подключения матрицы Sony к ПЛИС (Verilog)

26 апр. 2024, в 21:30

15000 руб./за проект

8266 f12 требуется сделать ревью и оптимизировать работу

26 апр. 2024, в 20:42

2000 руб./за проект

Answer 1 · 2019-01-15 10:12:38

У нас немного другая задача. Электронный архив, сканы "человеческих" документов. Но возможно общие с вашим проектом черты есть. Сначала мы реализовали видимо очень похожую на вашу просто свалку документов в кучу, с разделением по объектам учёта, которую тоже как у вас приходилось просматривать всю, когда что-то требовалось найти. Затем мы внедрили жёсткую кодификацию документов, которая уже позволяет чётко определять есть ли в конкретном деле документ нужного вида, и при необходимости сразу открыть его. При этом мы используем сразу два основных типа хранения документов. PDF и JPEG. В основном даже дела сканируются и редактируются в JPEG, а уже затем переводятся в PDF. При чем, как и вам, нам хотелось чтобы весь проект базировался на бесплатном софте. В общем то у нас это всё получилось. Вообще наш проект получился практически полностью бесплатным, за исключением оборудования и оплаты работ сотрудников.

Какой open-source PDM/PLM работает с PDF/скан + слой текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт