Strumenti per la manipolazione di PDF in Ubuntu - Poppler

A volte è necessario aggiungere una pagina a un PDF...

Indice

Oppure un altro giorno vorrai estrarre immagini e testo da un PDF

i cacciaviti sono molto occupati a inseguire documenti portatili Sopra c’è un’immagine generata da AI con il modello Flux 1)](https://www.glukhov.org/it/post/2024/09/flux-text-to-image/ “Flux 1 - modello di AI per immagini da testo”) che mostra come “i cacciaviti sono molto occupati a inseguire documenti portatili”.

Su Poppler

Poppler è una libreria di rendering PDF gratuita e open source utilizzata nei sistemi Linux, tra cui Ubuntu. Fornisce utilità da riga di comando per manipolare e convertire file PDF. Ecco un riassunto delle utilità di Poppler in Ubuntu e come utilizzarle:

Cos’è Poppler in Ubuntu?

  • Poppler è una libreria di rendering PDF basata sul codice xpdf-3.0.
  • Include diversi strumenti da riga di comando per estrarre testo, immagini, unire/splittare PDF e convertire PDF in altri formati.
  • Utilizzato comunemente negli ambienti desktop GNOME e KDE.

Installazione

Per installare le utilità di Poppler in Ubuntu, esegui:

sudo apt-get install poppler-utils

Poppler è una libreria di rendering PDF basata sul visualizzatore PDF Xpdf.

Questo pacchetto contiene utilità da riga di comando (basate su Poppler) per ottenere informazioni sui documenti PDF, convertirli in altri formati o manipolarli:

  • pdfdetach – elenca o estrae file incorporati (allegati)
  • pdffonts – analizzatore di font
  • pdfimages – estrattore di immagini
  • pdfinfo – informazioni del documento
  • pdfseparate – strumento per l’estrazione delle pagine
  • pdfsig – verifica le firme digitali
  • pdftocairo – convertitore PDF in PNG/JPEG/PDF/PS/EPS/SVG utilizzando Cairo
  • pdftohtml – convertitore PDF in HTML
  • pdftoppm – convertitore PDF in PPM/PNG/JPEG
  • pdftops – convertitore PDF in PostScript (PS)
  • pdftotext – estrattore di testo
  • pdfunite – strumento per unire documenti

Utilità principali di Poppler e utilizzo

  1. pdfinfo – Ottenere metadati PDF (titolo, autore, pagine, ecc.)

    pdfinfo file.pdf
    
  2. pdftotext – Estrai testo da un PDF

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – Estrai immagini da un PDF

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – Converti le pagine PDF in immagini (PNG, JPEG, ecc.)

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – Dividi un PDF in pagine singole

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – Unisci diversi PDF in uno

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – Converti PDF in HTML

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – Elenco dei font utilizzati in un PDF

    pdffonts file.pdf
    

Note aggiuntive

  • La maggior parte dei comandi supporta -h o --help per le opzioni dettagliate.
  • Poppler è preinstallato su molti sistemi Linux, ma se manca, poppler-utils può essere installato tramite apt.

Informazioni sul pacchetto Launchpad di Ubuntu

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: dati di introspezione GObject per poppler-glib
libpoppler-cpp-dev: libreria di rendering PDF -- file di sviluppo (interfaccia CPP)
libpoppler-cpp1: libreria di rendering PDF (libreria condivisa CPP)
libpoppler-cpp1-dbgsym: nessuna descrizione disponibile per libpoppler-cpp1-dbgsym in ubuntu plucky.
libpoppler-dev: libreria di rendering PDF -- file di sviluppo
libpoppler-glib-dev: libreria di rendering PDF -- file di sviluppo (interfaccia GLib)
libpoppler-glib-doc: libreria di rendering PDF -- documentazione per l'interfaccia GLib
libpoppler-glib8t64: libreria di rendering PDF (libreria condivisa basata su GLib)
libpoppler-glib8t64-dbgsym: simboli di debug per libpoppler-glib8t64
libpoppler-private-dev: libreria di rendering PDF -- file di sviluppo privati
libpoppler-qt5-1t64: libreria di rendering PDF (libreria condivisa basata su Qt 5)
libpoppler-qt5-1t64-dbgsym: simboli di debug per libpoppler-qt5-1t64
libpoppler-qt5-dev: libreria di rendering PDF -- file di sviluppo (interfaccia Qt 5)
libpoppler-qt6-3t64: libreria di rendering PDF (libreria condivisa basata su Qt 6)
libpoppler-qt6-3t64-dbgsym: simboli di debug per libpoppler-qt6-3t64
libpoppler-qt6-dev: libreria di rendering PDF -- file di sviluppo (interfaccia Qt 6)
libpoppler140: libreria di rendering PDF
libpoppler140-dbgsym: simboli di debug per libpoppler140
poppler-utils: utilità PDF (basate su Poppler)
poppler-utils-dbgsym: simboli di debug per poppler-utils