Ferramentas de manipulação de PDF no Ubuntu - Poppler
Às vezes você precisa adicionar uma página a um PDF...
Outro dia você pode querer extrair imagem e texto do pdf…
Acima está uma imagem gerada por IA pelo modelo Flux 1) de como “spanners estão muito ocupados perseguindo documentos portáteis”.
Sobre o Poppler
O Poppler é uma biblioteca de renderização de PDF gratuita e de código aberto utilizada em sistemas Linux, incluindo o Ubuntu. Ele fornece utilitários de linha de comando para manipular e converter arquivos PDF. Aqui está um resumo dos utilitários do Poppler no Ubuntu e como usá-los:
O que é o Poppler no Ubuntu?
- O Poppler é uma biblioteca de renderização de PDF baseada no código-fonte xpdf-3.0.
- Ele inclui vários utilitários de linha de comando para extrair texto, imagens, mesclar/dividir PDFs e converter PDFs para outros formatos.
- Comumente usado nos ambientes de desktop GNOME e KDE.
Instalação
Para instalar os utilitários do Poppler no Ubuntu, execute:
sudo apt-get install poppler-utils
O Poppler é uma biblioteca de renderização de PDF baseada no visualizador de PDF Xpdf.
Este pacote contém utilitários de linha de comando (baseados no Poppler) para obter informações de documentos PDF, convertê-los para outros formatos ou manipulá-los:
- pdfdetach – lista ou extrai arquivos anexados (anexos)
- pdffonts – analisador de fontes
- pdfimages – extrator de imagens
- pdfinfo – informações do documento
- pdfseparate – ferramenta de extração de páginas
- pdfsig – verifica assinaturas digitais
- pdftocairo – conversor de PDF para PNG/JPEG/PDF/PS/EPS/SVG usando Cairo
- pdftohtml – conversor de PDF para HTML
- pdftoppm – conversor de PDF para PPM/PNG/JPEG
- pdftops – conversor de PDF para PostScript (PS)
- pdftotext – extrator de texto
- pdfunite – ferramenta de mesclagem de documentos
Utilitários Principais do Poppler e Uso
-
pdfinfo
– Obter metadados do PDF (título, autor, páginas, etc.)pdfinfo file.pdf
-
pdftotext
– Extrair texto de um PDFpdftotext file.pdf [output.txt]
-
pdfimages
– Extrair imagens de um PDFpdfimages file.pdf output_prefix
-
pdftoppm
/pdftocairo
– Converter páginas do PDF em imagens (PNG, JPEG, etc.)pdftoppm -png file.pdf output_prefix
-
pdfseparate
– Dividir um PDF em páginas individuaispdfseparate file.pdf output_%d.pdf
-
pdfunite
– Mesclar múltiplos PDFs em um sópdfunite file1.pdf file2.pdf merged.pdf
-
pdftohtml
– Converter PDF para HTMLpdftohtml file.pdf [output.html]
-
pdffonts
– Listar fontes usadas em um PDFpdffonts file.pdf
Notas Adicionais
- A maioria dos comandos suporta
-h
ou--help
para opções detalhadas. - O Poppler está pré-instalado em muitos sistemas Linux, mas se estiver faltando,
poppler-utils
pode ser instalado viaapt
.
Informações sobre o pacote Launchpad do Ubuntu
https://launchpad.net/ubuntu/+source/poppler
gir1.2-poppler-0.18: dados de introspecção GObject para poppler-glib
libpoppler-cpp-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface CPP)
libpoppler-cpp1: biblioteca de renderização de PDF (biblioteca compartilhada CPP)
libpoppler-cpp1-dbgsym: nenhum resumo disponível para libpoppler-cpp1-dbgsym no ubuntu plucky.
libpoppler-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento
libpoppler-glib-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface GLib)
libpoppler-glib-doc: biblioteca de renderização de PDF -- documentação para a interface GLib
libpoppler-glib8t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em GLib)
libpoppler-glib8t64-dbgsym: símbolos de depuração para libpoppler-glib8t64
libpoppler-private-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento privados
libpoppler-qt5-1t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em Qt 5)
libpoppler-qt5-1t64-dbgsym: símbolos de depuração para libpoppler-qt5-1t64
libpoppler-qt5-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface Qt 5)
libpoppler-qt6-3t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em Qt 6)
libpoppler-qt6-3t64-dbgsym: símbolos de depuração para libpoppler-qt6-3t64
libpoppler-qt6-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface Qt 6)
libpoppler140: biblioteca de renderização de PDF
libpoppler140-dbgsym: símbolos de depuração para libpoppler140
poppler-utils: utilitários de PDF (baseados no Poppler)
poppler-utils-dbgsym: símbolos de depuração para poppler-utils