Инструменты для работы с PDF в Ubuntu — Poppler

Иногда нужно добавить страницу в PDF...

Содержимое страницы

Или, например, вы хотите извлечь изображение и текст из pdf. Это руководство является частью нашего Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати хаба.

ключевые шестерёнки очень заняты преследованием переносимых документов Выше приведено изображение, сгенерированное ИИ на основе модели Flux 1) того, как “ключевые шестерёнки очень заняты преследованием переносимых документов”.

О Poppler

Poppler — это бесплатная и открытая библиотека для рендеринга PDF, используемая в системах Linux, включая Ubuntu. Она предоставляет утилиты командной строки для манипуляции и преобразования PDF-файлов. Вот краткое описание утилит Poppler в Ubuntu и их использование:

Что такое Poppler в Ubuntu?

  • Poppler — это библиотека для рендеринга PDF, основанная на кодовой базе xpdf-3.0.
  • Она включает в себя несколько утилит командной строки для извлечения текста, изображений, объединения/разделения PDF, а также преобразования PDF в другие форматы.
  • Часто используется в рабочих средах GNOME и KDE.

Установка

Чтобы установить утилиты Poppler в Ubuntu, выполните:

sudo apt-get install poppler-utils

Poppler — это библиотека для рендеринга PDF, основанная на PDF-просмотрщике Xpdf.

Этот пакет содержит утилиты командной строки (на основе Poppler) для получения информации о PDF-документах, преобразования их в другие форматы или манипуляции с ними:

  • pdfdetach — перечисляет или извлекает встроенные файлы (приложения)
  • pdffonts — анализатор шрифтов
  • pdfimages — извлечитель изображений
  • pdfinfo — информация о документе
  • pdfseparate — инструмент для извлечения страниц
  • pdfsig — проверка цифровых подписей
  • pdftocairo — конвертер PDF в PNG/JPEG/PDF/PS/EPS/SVG с использованием Cairo
  • pdftohtml — конвертер PDF в HTML
  • pdftoppm — конвертер PDF в PPM/PNG/JPEG изображений
  • pdftops — конвертер PDF в PostScript (PS)
  • pdftotext — извлечение текста
  • pdfunite — инструмент объединения документов

Основные утилиты Poppler и их использование

  1. pdfinfo – Получение метаданных PDF (название, автор, страницы и т.д.)

    pdfinfo file.pdf
    
  2. pdftotext – Извлечение текста из PDF

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – Извлечение изображений из PDF

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – Конвертация страниц PDF в изображения (PNG, JPEG и т.д.)

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – Разделение PDF на отдельные страницы

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – Объединение нескольких PDF в один

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – Конвертация PDF в HTML

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – Список шрифтов, используемых в PDF

    pdffonts file.pdf
    

Дополнительные примечания

  • Большинство команд поддерживают -h или --help для получения подробной информации.
  • Poppler предустановлен во многих системах Linux, но если её нет, poppler-utils можно установить через apt.

Информация о пакете Launchpad Ubuntu

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: данные для интроспекции GObject для poppler-glib
libpoppler-cpp-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс CPP)
libpoppler-cpp1: библиотека для рендеринга PDF (общая библиотека CPP)
libpoppler-cpp1-dbgsym: краткое описание для libpoppler-cpp1-dbgsym в ubuntu plucky недоступно.
libpoppler-dev: библиотека для рендеринга PDF -- файлы разработки
libpoppler-glib-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс GLib)
libpoppler-glib-doc: библиотека для рендеринга PDF -- документация для интерфейса GLib
libpoppler-glib8t64: библиотека для рендеринга PDF (общая библиотека, основанная на GLib)
libpoppler-glib8t64-dbgsym: символы отладки для libpoppler-glib8t64
libpoppler-private-dev: библиотека для рендеринга PDF -- приватные файлы разработки
libpoppler-qt5-1t64: библиотека для рендеринга PDF (общая библиотека, основанная на Qt 5)
libpoppler-qt5-1t64-dbgsym: символы отладки для libpoppler-qt5-1t64
libpoppler-qt5-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс Qt 5)
libpoppler-qt6-3t64: библиотека для рендеринга PDF (общая библиотека, основанная на Qt 6)
libpoppler-qt6-3t64-dbgsym: символы отладки для libpoppler-qt6-3t64
libpoppler-qt6-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс Qt 6)
libpoppler140: библиотека для рендеринга PDF
libpoppler140-dbgsym: символы отладки для libpoppler140
poppler-utils: утилиты PDF (на основе Poppler)
poppler-utils-dbgsym: символы отладки для poppler-utils

Полезные ссылки