Инструменты для работы с PDF в Ubuntu — Poppler

Иногда вам нужно добавить страницу в PDF...

Содержимое страницы

Или еще один день, когда вы хотите извлечь изображение и текст из pdf

гайки очень заняты преследованием переносимых документов Выше приведено изображение, сгенерированное ИИ на основе модели Flux 1), показывающее, как “гайки очень заняты преследованием переносимых документов”.

О Poppler

Poppler - это бесплатная и открытая библиотека для отображения PDF, используемая в системах Linux, включая Ubuntu. Она предоставляет утилиты командной строки для манипулирования и конвертации PDF-файлов. Вот краткое описание утилит Poppler в Ubuntu и их использование:

Что такое Poppler в Ubuntu?

  • Poppler - это библиотека для отображения PDF, основанная на кодовой базе xpdf-3.0.
  • Она включает несколько утилит командной строки для извлечения текста, изображений, объединения/разделения PDF, а также конвертации PDF в другие форматы.
  • Часто используется в средах рабочего стола GNOME и KDE.

Установка

Чтобы установить утилиты Poppler в Ubuntu, выполните:

sudo apt-get install poppler-utils

Poppler - это библиотека для отображения PDF, основанная на просмотрщике PDF Xpdf.

Этот пакет содержит утилиты командной строки (на основе Poppler) для получения информации о PDF-документах, их конвертации в другие форматы или манипулирования ими:

  • pdfdetach – перечисляет или извлекает встроенные файлы (вложения)
  • pdffonts – анализатор шрифтов
  • pdfimages – извлечение изображений
  • pdfinfo – информация о документе
  • pdfseparate – инструмент извлечения страниц
  • pdfsig – проверка цифровых подписей
  • pdftocairo – конвертер PDF в PNG/JPEG/PDF/PS/EPS/SVG с использованием Cairo
  • pdftohtml – конвертер PDF в HTML
  • pdftoppm – конвертер PDF в PPM/PNG/JPEG изображений
  • pdftops – конвертер PDF в PostScript (PS)
  • pdftotext – извлечение текста
  • pdfunite – инструмент объединения документов

Ключевые утилиты Poppler и их использование

  1. pdfinfo – Получение метаданных PDF (название, автор, страницы и т.д.)

    pdfinfo file.pdf
    
  2. pdftotext – Извлечение текста из PDF

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – Извлечение изображений из PDF

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – Конвертация страниц PDF в изображения (PNG, JPEG и т.д.)

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – Разделение PDF на отдельные страницы

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – Объединение нескольких PDF в один

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – Конвертация PDF в HTML

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – Перечисление шрифтов, используемых в PDF

    pdffonts file.pdf
    

Дополнительные примечания

  • Большинство команд поддерживают параметр -h или --help для получения подробной информации.
  • Poppler предустановлен на многих системах Linux, но если его нет, poppler-utils можно установить через apt.

Информация о пакете Launchpad Ubuntu

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: данные для GObject introspection для poppler-glib
libpoppler-cpp-dev: библиотека для отображения PDF -- файлы разработки (интерфейс CPP)
libpoppler-cpp1: библиотека для отображения PDF (общий модуль CPP)
libpoppler-cpp1-dbgsym: краткое описание для libpoppler-cpp1-dbgsym в ubuntu plucky недоступно.
libpoppler-dev: библиотека для отображения PDF -- файлы разработки
libpoppler-glib-dev: библиотека для отображения PDF -- файлы разработки (интерфейс GLib)
libpoppler-glib-doc: библиотека для отображения PDF -- документация для интерфейса GLib
libpoppler-glib8t64: библиотека для отображения PDF (общий модуль GLib)
libpoppler-glib8t64-dbgsym: символы отладки для libpoppler-glib8t64
libpoppler-private-dev: библиотека для отображения PDF -- приватные файлы разработки
libpoppler-qt5-1t64: библиотека для отображения PDF (общий модуль Qt 5)
libpoppler-qt5-1t64-dbgsym: символы отладки для libpoppler-qt5-1t64
libpoppler-qt5-dev: библиотека для отображения PDF -- файлы разработки (интерфейс Qt 5)
libpoppler-qt6-3t64: библиотека для отображения PDF (общий модуль Qt 6)
libpoppler-qt6-3t64-dbgsym: символы отладки для libpoppler-qt6-3t64
libpoppler-qt6-dev: библиотека для отображения PDF -- файлы разработки (интерфейс Qt 6)
libpoppler140: библиотека для отображения PDF
libpoppler140-dbgsym: символы отладки для libpoppler140
poppler-utils: утилиты для работы с PDF (на основе Poppler)
poppler-utils-dbgsym: символы отладки для poppler-utils

Полезные ссылки