Ubuntu における PDF 操作ツール - Poppler

PDFにページを追加する必要がある場合があります。

目次

または、PDFから画像とテキストを抽出したい別の日もあります…

スパナーズはポータブルドキュメントを追いかけている 上記は、“スパナーズはポータブルドキュメントを追いかけている"というように見えるAI生成画像で、Flux 1モデルによって作成されました。

Popplerについて

Popplerは、Linuxシステム、特にUbuntuで使用される無料でオープンソースのPDFレンダリングライブラリです。PDFファイルを操作および変換するためのコマンドラインユーティリティを提供しています。UbuntuおよびPopplerユーティリティの概要と使用方法は以下の通りです:

UbuntuにおけるPopplerとは?

  • Popplerは、xpdf-3.0のコードベースに基づくPDFレンダリングライブラリです。
  • PDFからテキストや画像を抽出し、PDFをマージまたは分割し、他の形式に変換するための複数のコマンドラインツールを含んでいます。
  • GNOMEおよびKDEデスクトップ環境でよく使用されます。

インストール方法

UbuntuでPopplerユーティリティをインストールするには、以下のコマンドを実行してください:

sudo apt-get install poppler-utils

Popplerは、Xpdf PDFビューアーに基づいたPDFレンダリングライブラリです。

このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ(Popplerに基づく)が含まれています:

  • pdfdetach – 埋め込まれたファイル(添付ファイル)を一覧表示または抽出
  • pdffonts – フォントアナライザ
  • pdfimages – 画像抽出
  • pdfinfo – ドキュメント情報
  • pdfseparate – ページ抽出ツール
  • pdfsig – デジタル署名の検証
  • pdftocairo – Cairoを使用したPDFをPNG/JPEG/PDF/PS/EPS/SVGへのコンバーター
  • pdftohtml – PDFをHTMLに変換
  • pdftoppm – PDFをPPM/PNG/JPEG画像に変換
  • pdftops – PDFをPostScript(PS)に変換
  • pdftotext – テキスト抽出
  • pdfunite – ドキュメントのマージツール

Popplerの主要なユーティリティと使用方法

  1. pdfinfo – PDFのメタデータ(タイトル、著者、ページ数など)を取得

    pdfinfo file.pdf
    
  2. pdftotext – PDFからテキストを抽出

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – PDFから画像を抽出

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – PDFページを画像(PNG、JPEGなど)に変換

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – PDFを個々のページに分割

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – 複数のPDFを1つにマージ

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – PDFをHTMLに変換

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – PDFで使用されているフォントを一覧表示

    pdffonts file.pdf
    

その他の注意点

  • 多くのコマンドは-hまたは--helpで詳細なオプションを表示できます。
  • Popplerは多くのLinuxシステムに事前にインストールされていますが、インストールされていない場合はpoppler-utilsapt経由でインストールできます。

Ubuntu Launchpadパッケージ情報

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: poppler-glib用のGObject introspectionデータ
libpoppler-cpp-dev: PDFレンダリングライブラリ -- 開発ファイル(CPPインターフェース)
libpoppler-cpp1: PDFレンダリングライブラリ(CPP共有ライブラリ)
libpoppler-cpp1-dbgsym: Ubuntu pluckyにおけるlibpoppler-cpp1-dbgsymの概要がありません。
libpoppler-dev: PDFレンダリングライブラリ -- 開発ファイル
libpoppler-glib-dev: PDFレンダリングライブラリ -- 開発ファイル(GLibインターフェース)
libpoppler-glib-doc: GLibインターフェース用のPDFレンダリングライブラリ -- ドキュメント
libpoppler-glib8t64: GLibベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-glib8t64-dbgsym: libpoppler-glib8t64のデバッグシンボル
libpoppler-private-dev: PDFレンダリングライブラリ -- プライベート開発ファイル
libpoppler-qt5-1t64: Qt 5ベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-qt5-1t64-dbgsym: libpoppler-qt5-1t64のデバッグシンボル
libpoppler-qt5-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 5インターフェース)
libpoppler-qt6-3t64: Qt 6ベースの共有ライブラリ用のPDFレンダリングライブラリ
libpoppler-qt6-3t64-dbgsym: libpoppler-qt6-3t64のデバッグシンボル
libpoppler-qt6-dev: PDFレンダリングライブラリ -- 開発ファイル(Qt 6インターフェース)
libpoppler140: PDFレンダリングライブラリ
libpoppler140-dbgsym: libpoppler140のデバッグシンボル
poppler-utils: Popplerに基づくPDFユーティリティ
poppler-utils-dbgsym: poppler-utilsのデバッグシンボル

有用なリンク