Инструменты для работы с PDF в Ubuntu — Poppler
Иногда вам нужно добавить страницу в PDF...
Или еще один день, когда вы хотите извлечь изображение и текст из pdf…
Выше приведено изображение, сгенерированное ИИ на основе модели Flux 1), показывающее, как “гайки очень заняты преследованием переносимых документов”.
О Poppler
Poppler - это бесплатная и открытая библиотека для отображения PDF, используемая в системах Linux, включая Ubuntu. Она предоставляет утилиты командной строки для манипулирования и конвертации PDF-файлов. Вот краткое описание утилит Poppler в Ubuntu и их использование:
Что такое Poppler в Ubuntu?
- Poppler - это библиотека для отображения PDF, основанная на кодовой базе xpdf-3.0.
- Она включает несколько утилит командной строки для извлечения текста, изображений, объединения/разделения PDF, а также конвертации PDF в другие форматы.
- Часто используется в средах рабочего стола GNOME и KDE.
Установка
Чтобы установить утилиты Poppler в Ubuntu, выполните:
sudo apt-get install poppler-utils
Poppler - это библиотека для отображения PDF, основанная на просмотрщике PDF Xpdf.
Этот пакет содержит утилиты командной строки (на основе Poppler) для получения информации о PDF-документах, их конвертации в другие форматы или манипулирования ими:
- pdfdetach – перечисляет или извлекает встроенные файлы (вложения)
- pdffonts – анализатор шрифтов
- pdfimages – извлечение изображений
- pdfinfo – информация о документе
- pdfseparate – инструмент извлечения страниц
- pdfsig – проверка цифровых подписей
- pdftocairo – конвертер PDF в PNG/JPEG/PDF/PS/EPS/SVG с использованием Cairo
- pdftohtml – конвертер PDF в HTML
- pdftoppm – конвертер PDF в PPM/PNG/JPEG изображений
- pdftops – конвертер PDF в PostScript (PS)
- pdftotext – извлечение текста
- pdfunite – инструмент объединения документов
Ключевые утилиты Poppler и их использование
-
pdfinfo
– Получение метаданных PDF (название, автор, страницы и т.д.)pdfinfo file.pdf
-
pdftotext
– Извлечение текста из PDFpdftotext file.pdf [output.txt]
-
pdfimages
– Извлечение изображений из PDFpdfimages file.pdf output_prefix
-
pdftoppm
/pdftocairo
– Конвертация страниц PDF в изображения (PNG, JPEG и т.д.)pdftoppm -png file.pdf output_prefix
-
pdfseparate
– Разделение PDF на отдельные страницыpdfseparate file.pdf output_%d.pdf
-
pdfunite
– Объединение нескольких PDF в одинpdfunite file1.pdf file2.pdf merged.pdf
-
pdftohtml
– Конвертация PDF в HTMLpdftohtml file.pdf [output.html]
-
pdffonts
– Перечисление шрифтов, используемых в PDFpdffonts file.pdf
Дополнительные примечания
- Большинство команд поддерживают параметр
-h
или--help
для получения подробной информации. - Poppler предустановлен на многих системах Linux, но если его нет,
poppler-utils
можно установить черезapt
.
Информация о пакете Launchpad Ubuntu
https://launchpad.net/ubuntu/+source/poppler
gir1.2-poppler-0.18: данные для GObject introspection для poppler-glib
libpoppler-cpp-dev: библиотека для отображения PDF -- файлы разработки (интерфейс CPP)
libpoppler-cpp1: библиотека для отображения PDF (общий модуль CPP)
libpoppler-cpp1-dbgsym: краткое описание для libpoppler-cpp1-dbgsym в ubuntu plucky недоступно.
libpoppler-dev: библиотека для отображения PDF -- файлы разработки
libpoppler-glib-dev: библиотека для отображения PDF -- файлы разработки (интерфейс GLib)
libpoppler-glib-doc: библиотека для отображения PDF -- документация для интерфейса GLib
libpoppler-glib8t64: библиотека для отображения PDF (общий модуль GLib)
libpoppler-glib8t64-dbgsym: символы отладки для libpoppler-glib8t64
libpoppler-private-dev: библиотека для отображения PDF -- приватные файлы разработки
libpoppler-qt5-1t64: библиотека для отображения PDF (общий модуль Qt 5)
libpoppler-qt5-1t64-dbgsym: символы отладки для libpoppler-qt5-1t64
libpoppler-qt5-dev: библиотека для отображения PDF -- файлы разработки (интерфейс Qt 5)
libpoppler-qt6-3t64: библиотека для отображения PDF (общий модуль Qt 6)
libpoppler-qt6-3t64-dbgsym: символы отладки для libpoppler-qt6-3t64
libpoppler-qt6-dev: библиотека для отображения PDF -- файлы разработки (интерфейс Qt 6)
libpoppler140: библиотека для отображения PDF
libpoppler140-dbgsym: символы отладки для libpoppler140
poppler-utils: утилиты для работы с PDF (на основе Poppler)
poppler-utils-dbgsym: символы отладки для poppler-utils