Narzędzia do manipulowania plikami PDF w Ubuntu – Poppler

Czasami trzeba dodać stronę do PDF...

Page content

Lub inny dzień, kiedy chcesz wyodrębnić obraz i tekst z pliku PDF

spanery są bardzo zajęte śledzeniem portowych dokumentów Powyżej znajduje się AI-generated image by Flux 1 model) przedstawiający, jak “spanery są bardzo zajęte śledzeniem portowych dokumentów”.

O Popplerze

Poppler to darmowa i open-source biblioteka do renderowania PDF, używana w systemach Linux, w tym Ubuntu. Zapewnia narzędzia wiersza poleceń do manipulowania i konwertowania plików PDF. Oto podsumowanie narzędzi Popplera w Ubuntu i ich użycie:

Co to jest Poppler w Ubuntu?

  • Poppler to biblioteka renderowania PDF oparta na kodzie xpdf-3.0.
  • Zawiera wiele narzędzi wiersza poleceń do wyodrębniania tekstu, obrazów, łączenia/rozdzielania PDF oraz konwertowania PDF na inne formaty.
  • Często używana w środowiskach GNOME i KDE.

Instalacja

Aby zainstalować narzędzia Popplera w Ubuntu, uruchom:

sudo apt-get install poppler-utils

Poppler to biblioteka renderowania PDF oparta na programie do przeglądania PDF Xpdf.

Ten pakiet zawiera narzędzia wiersza poleceń (oparte na Popplerze) do uzyskiwania informacji o dokumentach PDF, konwertowania ich na inne formaty lub manipulowania nimi:

  • pdfdetach – lista lub wyodrębnianie załączonych plików (załączników)
  • pdffonts – analizator czcionek
  • pdfimages – ekstraktor obrazów
  • pdfinfo – informacje o dokumencie
  • pdfseparate – narzędzie do wyodrębniania stron
  • pdfsig – weryfikacja podpisów cyfrowych
  • pdftocairo – konwerter PDF na PNG/JPEG/PDF/PS/EPS/SVG przy użyciu Cairo
  • pdftohtml – konwerter PDF na HTML
  • pdftoppm – konwerter PDF na PPM/PNG/JPEG
  • pdftops – konwerter PDF na PostScript (PS)
  • pdftotext – ekstraktor tekstu
  • pdfunite – narzędzie do łączenia dokumentów

Główne narzędzia Popplera i ich użycie

  1. pdfinfo – Pobierz metadane PDF (tytuł, autor, liczba stron itp.)

    pdfinfo plik.pdf
    
  2. pdftotext – Wyodrębnij tekst z PDF

    pdftotext plik.pdf [wyjście.txt]
    
  3. pdfimages – Wyodrębnij obrazy z PDF

    pdfimages plik.pdf prefiks_wyjścia
    
  4. pdftoppm / pdftocairo – Konwertuj strony PDF na obrazy (PNG, JPEG itp.)

    pdftoppm -png plik.pdf prefiks_wyjścia
    
  5. pdfseparate – Podziel PDF na pojedyncze strony

    pdfseparate plik.pdf wyjście_%d.pdf
    
  6. pdfunite – Połącz wiele PDF w jeden

    pdfunite plik1.pdf plik2.pdf połączony.pdf
    
  7. pdftohtml – Konwertuj PDF na HTML

    pdftohtml plik.pdf [wyjście.html]
    
  8. pdffonts – Wyświetl czcionki używane w PDF

    pdffonts plik.pdf
    

Dodatkowe uwagi

  • Większość poleceń obsługuje -h lub --help dla szczegółowych opcji.
  • Poppler jest zainstalowany domyślnie na wielu systemach Linux, ale jeśli brakuje, poppler-utils można zainstalować za pomocą apt.

Informacje o pakiecie Launchpad Ubuntu

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: dane introspekcji GObject dla poppler-glib
libpoppler-cpp-dev: biblioteka renderowania PDF -- pliki deweloperskie (interfejs CPP)
libpoppler-cpp1: biblioteka renderowania PDF (dostępna biblioteka CPP)
libpoppler-cpp1-dbgsym: brak opisu dla libpoppler-cpp1-dbgsym w ubuntu plucky.
libpoppler-dev: biblioteka renderowania PDF -- pliki deweloperskie
libpoppler-glib-dev: biblioteka renderowania PDF -- pliki deweloperskie (interfejs GLib)
libpoppler-glib-doc: dokumentacja biblioteki renderowania PDF dla interfejsu GLib
libpoppler-glib8t64: biblioteka renderowania PDF (dostępna biblioteka GLib)
libpoppler-glib8t64-dbgsym: symbole debugowania dla libpoppler-glib8t64
libpoppler-private-dev: biblioteka renderowania PDF -- prywatne pliki deweloperskie
libpoppler-qt5-1t64: biblioteka renderowania PDF (dostępna biblioteka Qt 5)
libpoppler-qt5-1t64-dbgsym: symbole debugowania dla libpoppler-qt5-1t64
libpoppler-qt5-dev: biblioteka renderowania PDF -- pliki deweloperskie (interfejs Qt 5)
libpoppler-qt6-3t64: biblioteka renderowania PDF (dostępna biblioteka Qt 6)
libpoppler-qt6-3t64-dbgsym: symbole debugowania dla libpoppler-qt6-3t64
libpoppler-qt6-dev: biblioteka renderowania PDF -- pliki deweloperskie (interfejs Qt 6)
libpoppler140: biblioteka renderowania PDF
libpoppler140-dbgsym: symbole debugowania dla libpoppler140
poppler-utils: narzędzia do obsługi PDF (oparte na Popplerze)
poppler-utils-dbgsym: symbole debugowania dla poppler-utils

Przydatne linki