Ответы пользователя по тегу PDF
  • Как печать PDF из Microsoft EDGE с авто выбором источника бумаги под размер страницы?

    Adamos
    @Adamos
    Во-первых, нет смысла упираться в Edge, который все равно - перекрашенный Chrome, и исследовать вопрос имеет смысл по нему - элементарно больше ответов найдется.
    Во-вторых, продвинутой работы с принтером из браузера нет и быть не может - он из соображений безопасности сильно ограничен даже в информации о принтерах, не то что в настройках. Шаг влево, шаг вправо - сразу надо переключаться в "печатать, используя системный диалог", и смотреть уже там. А вот то, что там, зависит в первую очередь от драйвера принтера.
    Ответ написан
    Комментировать
  • Как исправить межстрочное расстояние при конвертации docx в pdf?

    Adamos
    @Adamos
    Эти библиотеки перегоняют документ через HTML. Можно присовокупить стиль с нулевым отступом абзаца.
    Или выгнать тот промежуточный HTML и посмотреть, что в нем, собственно, не так.
    Ответ написан
    Комментировать
  • Есть ли возможность получить читаемый текст?

    Adamos
    @Adamos
    Это не "иероглифы", это тот самый текст, только в ужатой кодировке - символы идут под другими номерами.
    При большом желании можно попробовать подобрать соответствие каждой букве и "расшифровать" текст.
    Но не исключено, что на другой аналогичной PDF номера символов будут иными.
    Так что чисто графическое распознавание и проще, и надежнее.
    Ответ написан
    4 комментария
  • Почему один пдф открывается, а другой нет?

    Adamos
    @Adamos
    Проблемы, скорее всего, не в файлах, а в той информации, которую вы опустили в вопросе.
    Впрочем, есть возможность проверить PDF-файлы на возможные проблемы формата.
    Например, бесплатный VeraPdf - очень качественный инструмент.
    Правда, он требует довольно качественного оператора - сообщения о проблемах еще нужно прочитать и понять...
    Ответ написан
    Комментировать
  • Как генерировать PDF документы из шаблонов?

    Adamos
    @Adamos
    mPDF позволяет положить исходный PDF фоном и сверху (по координатам) налепить добавки.
    Но для произвольного PDF вы просто не будете знать, что куда положить.

    Стоит вернуться к задаче и пересмотреть ее. Откуда берется PDF у пользователя? Если это бланк, который он каким-то образом заполняет, а вы добавляете свою информацию - нужно просто дать ему форму на сайте, собрать его данные, добавить ваши и генерировать из них окончательный PDF.
    Ответ написан
    Комментировать
  • Конвертер файлов с Word/EXEL в PDF на своем хостинге?

    Adamos
    @Adamos
    Headless LibreOffice, совершенно обычное решение.
    Ответ написан
    Комментировать
  • Как достать с pdf файла (с ссылки на pdf)?

    Adamos
    @Adamos
    Фокус в том, что в PDF никакой таблицы нет.
    Там тупо строчки по координатам, причем по координатам не центра ячейки, а начала строчки.
    И любой перенос, а также смена шрифта (выделение полужирным, например) делит текст на несколько строчек.
    Поэтому просто парсить текст не прокатит - несколько строчек развалятся, а пустые ячейки не определятся вовсе, и куда относится следующий после них текст - определить не получится.
    На коленке можно попытаться сконвертировать PDF в более текстовый формат - EPS или SVG - и пытаться разобрать его, но это будет хоть и решаемой, но весьма трудоемкой задачей.
    Предложенная выше библиотека, видимо, разбирает сам формат и пытается угадать по расположению строчек, как их собрать обратно в таблицу.
    Других возможностей и каких-то простых решений можно не искать.

    Кроме, разве что, возможности договориться получать там, где это расписание делается, не PDF, а DOCX/ODT, из которого его выгоняют ;)
    Ответ написан
  • Как вставить ПДФ страницы в Эксель?

    Adamos
    @Adamos
    Боги! Какое вообще отношение Ёксель может иметь к
    способ перевода любых ПДФ в качественные изображения

    PDF - это и есть изображение того идеального качества, которое имеется у вас в наличии.
    Улучшать в нем просто нечего - если картинка в PDF жестко пожата JPEG-ом и ее разрешение уменьшено до экранного качества - все, ничего другого вы из нее уже ничем не вытянете.
    А уж игрищами с офисным пакетом любую информацию можно только испортить.
    Ответ написан
  • Как создать PDF из файлов в папках с нормальной нумерацией?

    Adamos
    @Adamos
    /usr/bin/pdfjam \
    1/001.pdf '-' \
    1/002.pdf '-' \
    ...
    3/020.pdf '-' \
    --outfile result.pdf
    Ответ написан
  • Почему меняется толщина линий в pdf illustrator?

    Adamos
    @Adamos
    Можно просто превратить линии в фигуры, с их масштабированием проблем быть не должно.
    Ответ написан
  • Можно ли извлечь интерактивную карту сайта в пдф-файл или в файл-картинку?

    Adamos
    @Adamos
    Правой кнопкой по карте - открыть только этот фрейм.
    Зум до комфортного для просмотра масштаба.
    Правой кнопкой по карте - открыть картинку в новом окне. И соседнюю. И другую. И подумать над их урлами.

    Хотя, по моему многократному опыту поездок в Питер, достаточно просто запомнить (распечатать) те пять-шесть маршрутов, которые тебе реально могут понадобиться за время поездки. А если есть мобильный интернет - то просто поставить Яндекс.Карты на сотовый, и вообще ничего можно не запоминать.
    Ответ написан
    Комментировать
  • Почему в PDF непонятные символы вместо грузинских?

    Adamos
    @Adamos
    FPDF, внезапно, не дружит с UTF-8 и даже на своей официальной странице предлагает для этого форк:
    www.fpdf.org/en/script/script92.php

    А вот в mPDF UTF-8 по умолчанию, так что вы, скорее всего, просто выбрали неудачный инструмент.
    Ответ написан
    2 комментария
  • Как клиенту самостоятельно менять фотографии в документе PDF?

    Adamos
    @Adamos
    Есть перпендикулярный вариант IDML, если типография им не погнушается.
    Весь макет в XML-формате, а клиенту можно соорудить веб-сервис, чтобы он подбрасывал в него картинки.

    Правда, мысль о том, как клиентские фоточки в RGB будут отпечатаны в типографии без нормальной обработки, делает мне больно ;)
    Ответ написан
    Комментировать
  • Как делать PDF по шаблону?

    Adamos
    @Adamos
    Если пиксель-в-пиксель, то можно написать шаблон на языке Postscript, заменить в нем нужные поля и конвертировать в PDF. Поскольку PDF - это и есть сжатый Postscript, точность обеспечена.
    Уж не знаю, какие библиотеки есть для дистилляции в Джаве, но есть открытый Ghostscript на С++.
    Ответ написан
    Комментировать
  • Как преобразовывать PDF в Excel?

    Adamos
    @Adamos
    Идея такая: проследить, откуда берутся эти PDF, и получить там более вменяемый исходник. Это перспективно, в отличие от любых костылей, которые вам удастся нагородить для решения задачи в том виде, как она поставлена сейчас.
    Ответ написан
    Комментировать
  • Как удалить идентифицирующую покупателя информацию из PDF?

    Adamos
    @Adamos
    Видимое - редактором. Inkscape, например.
    Невидимое, если оно не-графическое, теоретически должен отсеять виртуальный принтер в PDF.
    Если, конечно, он не поленится и не отправит на печать исходник, не жуя.
    Но вообще-то в PDF могут быть зашиты не только личные данные, но и скрипты, например. Да и некоторые механизмы защиты там вроде бы предусмотрены... признаться, копаться нужды не было, точнее сказать не могу.
    Ответ написан
    Комментировать
  • Парсинг тестов из формата PDF с правильным ответом, как реализовать на Python?

    Adamos
    @Adamos
    Есть ощущение, что галочки и точечки - это просто символы соответствующего шрифта, а не графика.
    Так что даже простой pdftotext может дать материал, пригодный для обработки.
    А то и - страшно сказать - тупое копирование всего текста из программы, в которой вы просматриваете эту PDF.

    P.S. Дебильность теста доставляет, конечно... "На какой ноге болел палец у Добчинского", классика.
    Ответ написан
    Комментировать
  • Как автоизвлечь все изображения из pdf документа?

    Adamos
    @Adamos
    Под Linux есть специализированная утилита pdfimages в пакете xpdf. Открытая, бесплатная и надежная.
    Под окошками - какие-то платные комбайны и, конечно, Акробат Про.
    Ответ написан
    Комментировать
  • Можно ли узнать какой из двух файлов был создан раньше?

    Adamos
    @Adamos
    Точно узнать нельзя, в формате PDF нет обязательных полей такого рода.
    Конкретная программа может записать свои данные (в т.ч. и время создания) в комментарии в начале файла - это можно посмотреть программой, которая покажет бинарный файл голым текстом.
    Вот, например, билеты в Мариинку:
    %PDF-1.7
    5 0 obj
    << /Type /Page /Parent 1 0 R /LastModified (D:20221224000520+03'00') /Resources 
    2 0 R /MediaBox [0.00 0.00 515.00 803.00] /CropBox [0.00 0.00 515.00 803.00] /Bl
    eedBox [0.00 0.00 515.00 803.00] /TrimBox [0.00 0.00 515.00 803.00] /ArtBox [0.0
    0 0.00 515.00 803.00] /Contents 6 0 R /Rotate 0 /Group << /Type /Group /S /Trans
    parency /CS /DeviceRGB >> /Annots [ 4 0 R ] /PZ 1 >>
    endobj

    /LastModified (D:20221224000520+03'00')
    Но из десятка PDF, которые нашлись у меня под рукой (и сгенерированные серверами, и сверстанные в издательствах) такое поле встретилось только у одной.

    А задача проверки неизменности файла, как уже было сказано, решается только электронной подписью, специально для этого и созданной.
    Ответ написан
    Комментировать