Инструменты для работы с PDF в Ubuntu — Poppler
Иногда нужно добавить страницу в PDF...
Или, например, вы хотите извлечь изображение и текст из pdf. Это руководство является частью нашего Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати хаба.
Выше приведено изображение, сгенерированное ИИ на основе модели Flux 1) того, как “ключевые шестерёнки очень заняты преследованием переносимых документов”.
О Poppler
Poppler — это бесплатная и открытая библиотека для рендеринга PDF, используемая в системах Linux, включая Ubuntu. Она предоставляет утилиты командной строки для манипуляции и преобразования PDF-файлов. Вот краткое описание утилит Poppler в Ubuntu и их использование:
Что такое Poppler в Ubuntu?
- Poppler — это библиотека для рендеринга PDF, основанная на кодовой базе xpdf-3.0.
- Она включает в себя несколько утилит командной строки для извлечения текста, изображений, объединения/разделения PDF, а также преобразования PDF в другие форматы.
- Часто используется в рабочих средах GNOME и KDE.
Установка
Чтобы установить утилиты Poppler в Ubuntu, выполните:
sudo apt-get install poppler-utils
Poppler — это библиотека для рендеринга PDF, основанная на PDF-просмотрщике Xpdf.
Этот пакет содержит утилиты командной строки (на основе Poppler) для получения информации о PDF-документах, преобразования их в другие форматы или манипуляции с ними:
- pdfdetach — перечисляет или извлекает встроенные файлы (приложения)
- pdffonts — анализатор шрифтов
- pdfimages — извлечитель изображений
- pdfinfo — информация о документе
- pdfseparate — инструмент для извлечения страниц
- pdfsig — проверка цифровых подписей
- pdftocairo — конвертер PDF в PNG/JPEG/PDF/PS/EPS/SVG с использованием Cairo
- pdftohtml — конвертер PDF в HTML
- pdftoppm — конвертер PDF в PPM/PNG/JPEG изображений
- pdftops — конвертер PDF в PostScript (PS)
- pdftotext — извлечение текста
- pdfunite — инструмент объединения документов
Основные утилиты Poppler и их использование
-
pdfinfo– Получение метаданных PDF (название, автор, страницы и т.д.)pdfinfo file.pdf -
pdftotext– Извлечение текста из PDFpdftotext file.pdf [output.txt] -
pdfimages– Извлечение изображений из PDFpdfimages file.pdf output_prefix -
pdftoppm/pdftocairo– Конвертация страниц PDF в изображения (PNG, JPEG и т.д.)pdftoppm -png file.pdf output_prefix -
pdfseparate– Разделение PDF на отдельные страницыpdfseparate file.pdf output_%d.pdf -
pdfunite– Объединение нескольких PDF в одинpdfunite file1.pdf file2.pdf merged.pdf -
pdftohtml– Конвертация PDF в HTMLpdftohtml file.pdf [output.html] -
pdffonts– Список шрифтов, используемых в PDFpdffonts file.pdf
Дополнительные примечания
- Большинство команд поддерживают
-hили--helpдля получения подробной информации. - Poppler предустановлен во многих системах Linux, но если её нет,
poppler-utilsможно установить черезapt.
Информация о пакете Launchpad Ubuntu
https://launchpad.net/ubuntu/+source/poppler
gir1.2-poppler-0.18: данные для интроспекции GObject для poppler-glib
libpoppler-cpp-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс CPP)
libpoppler-cpp1: библиотека для рендеринга PDF (общая библиотека CPP)
libpoppler-cpp1-dbgsym: краткое описание для libpoppler-cpp1-dbgsym в ubuntu plucky недоступно.
libpoppler-dev: библиотека для рендеринга PDF -- файлы разработки
libpoppler-glib-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс GLib)
libpoppler-glib-doc: библиотека для рендеринга PDF -- документация для интерфейса GLib
libpoppler-glib8t64: библиотека для рендеринга PDF (общая библиотека, основанная на GLib)
libpoppler-glib8t64-dbgsym: символы отладки для libpoppler-glib8t64
libpoppler-private-dev: библиотека для рендеринга PDF -- приватные файлы разработки
libpoppler-qt5-1t64: библиотека для рендеринга PDF (общая библиотека, основанная на Qt 5)
libpoppler-qt5-1t64-dbgsym: символы отладки для libpoppler-qt5-1t64
libpoppler-qt5-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс Qt 5)
libpoppler-qt6-3t64: библиотека для рендеринга PDF (общая библиотека, основанная на Qt 6)
libpoppler-qt6-3t64-dbgsym: символы отладки для libpoppler-qt6-3t64
libpoppler-qt6-dev: библиотека для рендеринга PDF -- файлы разработки (интерфейс Qt 6)
libpoppler140: библиотека для рендеринга PDF
libpoppler140-dbgsym: символы отладки для libpoppler140
poppler-utils: утилиты PDF (на основе Poppler)
poppler-utils-dbgsym: символы отладки для poppler-utils
Полезные ссылки
- Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати
- Как извлечь изображения из PDF - Справочник
- Справочник Bash
- Изменение размера изображений с помощью Imagemagik
- https://en.wikipedia.org/wiki/Poppler_(software)
- Переустановка Linux
- Справочник Kubernetes
- Справочник Docker
- Декодирование и печать JWT-токена