Ubuntu における PDF 操作ツール - Poppler
PDFにページを追加する必要がある場合があります。
目次
または、PDFから画像とテキストを抽出したい別の日もあります…
上記は、“スパナーズはポータブルドキュメントを追いかけている"というように見えるAI生成画像で、Flux 1モデルによって作成されました。
Popplerについて
Popplerは、Linuxシステム、特にUbuntuで使用される無料でオープンソースのPDFレンダリングライブラリです。PDFファイルを操作および変換するためのコマンドラインユーティリティを提供しています。UbuntuおよびPopplerユーティリティの概要と使用方法は以下の通りです:
UbuntuにおけるPopplerとは?
- Popplerは、xpdf-3.0のコードベースに基づくPDFレンダリングライブラリです。
- PDFからテキストや画像を抽出し、PDFをマージまたは分割し、他の形式に変換するための複数のコマンドラインツールを含んでいます。
- GNOMEおよびKDEデスクトップ環境でよく使用されます。
インストール方法
UbuntuでPopplerユーティリティをインストールするには、以下のコマンドを実行してください:
sudo apt-get install poppler-utils
Popplerは、Xpdf PDFビューアーに基づいたPDFレンダリングライブラリです。
このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ(Popplerに基づく)が含まれています:
- pdfdetach – 埋め込まれたファイル(添付ファイル)を一覧表示または抽出
- pdffonts – フォントアナライザ
- pdfimages – 画像抽出
- pdfinfo – ドキュメント情報
- pdfseparate – ページ抽出ツール
- pdfsig – デジタル署名の検証
- pdftocairo – Cairoを使用したPDFをPNG/JPEG/PDF/PS/EPS/SVGへのコンバーター
- pdftohtml – PDFをHTMLに変換
- pdftoppm – PDFをPPM/PNG/JPEG画像に変換
- pdftops – PDFをPostScript(PS)に変換
- pdftotext – テキスト抽出
- pdfunite – ドキュメントのマージツール
Popplerの主要なユーティリティと使用方法
-
pdfinfo
– PDFのメタデータ(タイトル、著者、ページ数など)を取得pdfinfo file.pdf
-
pdftotext
– PDFからテキストを抽出pdftotext file.pdf [output.txt]
-
pdfimages
– PDFから画像を抽出pdfimages file.pdf output_prefix
-
pdftoppm
/pdftocairo
– PDFページを画像(PNG、JPEGなど)に変換pdftoppm -png file.pdf output_prefix
-
pdfseparate
– PDFを個々のページに分割pdfseparate file.pdf output_%d.pdf
-
pdfunite
– 複数のPDFを1つにマージpdfunite file1.pdf file2.pdf merged.pdf
-
pdftohtml
– PDFをHTMLに変換pdftohtml file.pdf [output.html]
-
pdffonts
– PDFで使用されているフォントを一覧表示pdffonts file.pdf
その他の注意点
- 多くのコマンドは
-h
または--help
で詳細なオプションを表示できます。 - Popplerは多くのLinuxシステムに事前にインストールされていますが、インストールされていない場合は
poppler-utils
をapt
経由でインストールできます。
Ubuntu Launchpadパッケージ情報
https://launchpad.net/ubuntu/+source/poppler
gir1.2-poppler-0.18: poppler-glib用のGObject introspectionデータ
libpoppler-cpp-dev: PDFレンダリングライブラリ -- 開発ファイル(CPPインターフェース)
libpoppler-cpp1: PDFレンダリングライブラリ(CPP共有ライブラリ)
libpoppler-cpp1-dbgsym: Ubuntu pluckyにおけるlibpoppler-cpp1-dbgsymの概要がありません。
libpoppler-dev: PDFレンダリングライブラリ -- 開発ファイル
libpoppler-glib-dev: PDFレンダリングライブラリ -- 開発ファイル(GLibインターフェース)
libpoppler-glib-doc: GLibインターフェース用のPDFレンダリングライブラリ -- ドキュメント
libpoppler-glib8t64: GLibベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-glib8t64-dbgsym: libpoppler-glib8t64のデバッグシンボル
libpoppler-private-dev: PDFレンダリングライブラリ -- プライベート開発ファイル
libpoppler-qt5-1t64: Qt 5ベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-qt5-1t64-dbgsym: libpoppler-qt5-1t64のデバッグシンボル
libpoppler-qt5-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 5インターフェース)
libpoppler-qt6-3t64: Qt 6ベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-qt6-3t64-dbgsym: libpoppler-qt6-3t64のデバッグシンボル
libpoppler-qt6-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 6インターフェース)
libpoppler140: PDFレンダリングライブラリ
libpoppler140-dbgsym: libpoppler140のデバッグシンボル
poppler-utils: Popplerに基づくPDFユーティリティ
poppler-utils-dbgsym: poppler-utilsのデバッグシンボル