Ferramentas de manipulação de PDF no Ubuntu - Poppler

Às vezes você precisa adicionar uma página a um PDF...

Conteúdo da página

Outro dia você pode querer extrair imagem e texto do pdf

spanners estão muito ocupados perseguindo documentos portáteis Acima está uma imagem gerada por IA pelo modelo Flux 1) de como “spanners estão muito ocupados perseguindo documentos portáteis”.

Sobre o Poppler

O Poppler é uma biblioteca de renderização de PDF gratuita e de código aberto utilizada em sistemas Linux, incluindo o Ubuntu. Ele fornece utilitários de linha de comando para manipular e converter arquivos PDF. Aqui está um resumo dos utilitários do Poppler no Ubuntu e como usá-los:

O que é o Poppler no Ubuntu?

  • O Poppler é uma biblioteca de renderização de PDF baseada no código-fonte xpdf-3.0.
  • Ele inclui vários utilitários de linha de comando para extrair texto, imagens, mesclar/dividir PDFs e converter PDFs para outros formatos.
  • Comumente usado nos ambientes de desktop GNOME e KDE.

Instalação

Para instalar os utilitários do Poppler no Ubuntu, execute:

sudo apt-get install poppler-utils

O Poppler é uma biblioteca de renderização de PDF baseada no visualizador de PDF Xpdf.

Este pacote contém utilitários de linha de comando (baseados no Poppler) para obter informações de documentos PDF, convertê-los para outros formatos ou manipulá-los:

  • pdfdetach – lista ou extrai arquivos anexados (anexos)
  • pdffonts – analisador de fontes
  • pdfimages – extrator de imagens
  • pdfinfo – informações do documento
  • pdfseparate – ferramenta de extração de páginas
  • pdfsig – verifica assinaturas digitais
  • pdftocairo – conversor de PDF para PNG/JPEG/PDF/PS/EPS/SVG usando Cairo
  • pdftohtml – conversor de PDF para HTML
  • pdftoppm – conversor de PDF para PPM/PNG/JPEG
  • pdftops – conversor de PDF para PostScript (PS)
  • pdftotext – extrator de texto
  • pdfunite – ferramenta de mesclagem de documentos

Utilitários Principais do Poppler e Uso

  1. pdfinfo – Obter metadados do PDF (título, autor, páginas, etc.)

    pdfinfo file.pdf
    
  2. pdftotext – Extrair texto de um PDF

    pdftotext file.pdf [output.txt]
    
  3. pdfimages – Extrair imagens de um PDF

    pdfimages file.pdf output_prefix
    
  4. pdftoppm / pdftocairo – Converter páginas do PDF em imagens (PNG, JPEG, etc.)

    pdftoppm -png file.pdf output_prefix
    
  5. pdfseparate – Dividir um PDF em páginas individuais

    pdfseparate file.pdf output_%d.pdf
    
  6. pdfunite – Mesclar múltiplos PDFs em um só

    pdfunite file1.pdf file2.pdf merged.pdf
    
  7. pdftohtml – Converter PDF para HTML

    pdftohtml file.pdf [output.html]
    
  8. pdffonts – Listar fontes usadas em um PDF

    pdffonts file.pdf
    

Notas Adicionais

  • A maioria dos comandos suporta -h ou --help para opções detalhadas.
  • O Poppler está pré-instalado em muitos sistemas Linux, mas se estiver faltando, poppler-utils pode ser instalado via apt.

Informações sobre o pacote Launchpad do Ubuntu

https://launchpad.net/ubuntu/+source/poppler

gir1.2-poppler-0.18: dados de introspecção GObject para poppler-glib
libpoppler-cpp-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface CPP)
libpoppler-cpp1: biblioteca de renderização de PDF (biblioteca compartilhada CPP)
libpoppler-cpp1-dbgsym: nenhum resumo disponível para libpoppler-cpp1-dbgsym no ubuntu plucky.
libpoppler-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento
libpoppler-glib-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface GLib)
libpoppler-glib-doc: biblioteca de renderização de PDF -- documentação para a interface GLib
libpoppler-glib8t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em GLib)
libpoppler-glib8t64-dbgsym: símbolos de depuração para libpoppler-glib8t64
libpoppler-private-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento privados
libpoppler-qt5-1t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em Qt 5)
libpoppler-qt5-1t64-dbgsym: símbolos de depuração para libpoppler-qt5-1t64
libpoppler-qt5-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface Qt 5)
libpoppler-qt6-3t64: biblioteca de renderização de PDF (biblioteca compartilhada baseada em Qt 6)
libpoppler-qt6-3t64-dbgsym: símbolos de depuração para libpoppler-qt6-3t64
libpoppler-qt6-dev: biblioteca de renderização de PDF -- arquivos de desenvolvimento (interface Qt 6)
libpoppler140: biblioteca de renderização de PDF
libpoppler140-dbgsym: símbolos de depuração para libpoppler140
poppler-utils: utilitários de PDF (baseados no Poppler)
poppler-utils-dbgsym: símbolos de depuração para poppler-utils