Comment extraire des images d’un PDF ?

Utilisez pdfimages du package poppler-utils . Utilisation de base - pdfimages /chemin/vers/fichier.pdf /chemin/vers/sortie/image . Les images sont enregistrées sous le nom image-000.ppm, image-001.ppm, etc. Utilisez l’option -j pour enregistrer en JPEG lorsqu’il est possible.

Qu’est-ce que poppler ?

Poppler est une bibliothèque de rendu PDF et un ensemble d’utilitaires en ligne de commande (par exemple pdfimages , pdftotext ). Elle permet d’extraire des images, du texte et d’autres contenus à partir de PDF. Installez-la avec poppler-utils sur Debian/Ubuntu ou l’équivalent de votre distribution.

Peut-on extraire des images au format JPEG ou PNG avec pdfimages ?

Oui. Utilisez -j pour JPEG (lorsque le PDF contient des JPEG). Utilisez -png pour PNG (si votre version le prend en charge). La sortie par défaut est PPM/PBM ; vous pouvez la convertir avec ImageMagick si nécessaire.

Comment extraire des images uniquement de certaines pages ?

Utilisez -f (page initiale) et -l (page finale). Exemple : pdfimages -f 2 -l 5 -j input.pdf image extrait les images des pages 2 à 5 au format JPEG.

Puis-je extraire des images à une résolution personnalisée avec pdfimages ?

Non. pdfimages extrait les images intégrées uniquement à leur résolution originale . Pour une résolution spécifique (par exemple, 300), utilisez un rendu comme PyMuPDF (fitz) et rendez la page en pixmap avec le paramètre dpi souhaité.

Comment extraire des images d’un PDF protégé par mot de passe ?

Utilisez -opw 'ownerpassword' pour le mot de passe du propriétaire ou -upw 'userpassword' pour le mot de passe utilisateur. Exemple : pdfimages -opw 'mypass' -j file.pdf image .

Extrayez des images à partir de PDF avec poppler

« Lorsque vous devez extraire une image d'un fichier PDF »

Sommaire

Parfois, il existe un besoin réel d’enregistrer des images d’un PDF sans faire de capture d’écran ou sans afficher le PDF à l’écran. pdfimages y aide. Ce guide fait partie de notre Outils de documentation en 2026 : Markdown, LaTeX, PDF et flux de travail d’impression hub.

Une image de bande dessinée d’un homme qui prend une photo du diagramme à l’écran

Pour extraire des images d’un fichier PDF sous Linux, l’outil le plus courant et le plus efficace est l’utilitaire en ligne de commande pdfimages,
qui fait partie du package poppler-utils.

Utilisation de l’outil `pdfimages` sous Linux : Instructions étape par étape

1. Installer pdfimages (si ce n’est pas déjà fait) :

La plupart des distributions Linux incluent pdfimages par défaut. Si nécessaire, installez-le à l’aide de votre gestionnaire de paquets :

sudo apt-get install poppler-utils

ou pour Fedora :

sudo dnf install poppler-utils

2. Ouvrir un terminal :

Appuyez sur Ctrl + Alt + T pour ouvrir une fenêtre de terminal.

3. Exécuter pdfimages pour extraire les images :

Syntaxe de base :

pdfimages

Exemple :

pdfimages /chemin/vers/fichier.pdf /chemin/vers/sortie/image

Cela extraira toutes les images de fichier.pdf et les enregistrera sous forme de image-000.ppm, image-001.ppm, etc., dans le répertoire de sortie spécifié.

4. Extraire les images au format JPEG (si souhaité) :

Pour extraire les images au format JPEG (lorsqu’il est possible), utilisez l’option -j :

pdfimages -j /chemin/vers/fichier.pdf /chemin/vers/sortie/image

Cela enregistrera les images JPEG sous forme de fichiers .jpg.

5. Extraire les images d’une page spécifique :

Pour extraire les images d’une plage de pages, utilisez -f (première page) et -l (dernière page) :

pdfimages -f 2 -l 5 -j /chemin/vers/fichier.pdf /chemin/vers/sortie/image

Cela extraira les images des pages 2 à 5.

6. Options supplémentaires :

Pour extraire les images au format PNG : utilisez -png (si pris en charge par votre version).
Pour les PDF protégés par mot de passe, utilisez -opw 'motdepassepropriétaire' ou -upw 'motdepasseutilisateur'.

Notes

Le format de sortie par défaut est PPM (en couleur) ou PBM (en noir et blanc). Utilisez -j pour JPEG, ou convertissez les fichiers PPM/PBM en d’autres formats à l’aide d’outils comme convert d’ImageMagick si nécessaire.
Les fichiers de sortie sont automatiquement numérotés et enregistrés dans le répertoire spécifié.

Tableau récapitulatif

Exemple de commande	Description
`pdfimages input.pdf image`	Extrait toutes les images au format par défaut PPM/PBM
`pdfimages -j input.pdf image`	Extrait les images au format JPEG lorsqu’elles sont possibles
`pdfimages -f 3 -l 5 input.pdf image`	Extrait les images des pages 3 à 5
`pdfimages -opw 'motdepasse' -j input.pdf image`	Extrait les images d’un PDF protégé par un mot de passe propriétaire

Cette méthode est efficace et fonctionne pour la plupart des PDF contenant des images intégrées. Cependant :

pdfimages extrait les images à leur résolution originale uniquement.
Pour contrôler la résolution de sortie, utilisez une bibliothèque de rendu PDF comme PyMuPDF et spécifiez la valeur DPI souhaitée lors de la création de l’image.

Comment sauvegarder des images d’un PDF avec une résolution spécifique.

Vous ne pouvez pas spécifier la résolution des images extraites lors de l’utilisation de pdfimages, car cet outil extrait les images intégrées telles quelles, en conservant leur format et leur résolution d’origine, sans redimensionnement ou altération de la qualité. La résolution est déterminée par la manière dont les images ont été stockées dans le PDF, et pdfimages ne propose pas d’option pour les agrandir ou les réduire lors de l’extraction.

Si vous souhaitez extraire des images à une résolution spécifique (par exemple, afficher une page ou une partie d’une page sous forme d’image à une résolution choisie en DPI), vous devez utiliser une bibliothèque de rendu PDF ou un outil comme PyMuPDF (fitz). Avec PyMuPDF, vous pouvez spécifier la résolution souhaitée à l’aide du paramètre dpi lors du rendu d’une page en image :

import fitz  # PyMuPDF
doc = fitz.open("input.pdf")
page = doc.load_page(0)  # première page
pix = page.get_pixmap(dpi=300)  # rendu à 300 DPI
pix.save("output.png")

Cette approche crée une image rasterisée de la page à la résolution spécifiée, plutôt qu’extraire les images intégrées d’origine.

Autres outils pour extraire des images de PDF

Le meilleur logiciel pour extraire des images de PDF sans perdre de résolution sont ceux qui extraient directement les images intégrées d’origine, plutôt que de les rendre ou de les redimensionner. Les choix les plus courants incluent :

Adobe Acrobat Pro : Propose une fonction dédiée « Exporter toutes les images », qui extrait les images dans leur qualité et format d’origine sous forme de fichiers indépendants. Cette méthode est très fiable et préserve exactement la résolution et la qualité des images telles qu’elles sont stockées dans le PDF.
pdfimages (du pack XPDF/Poppler) : Un outil gratuit, open source, en ligne de commande disponible sur Linux et d’autres plateformes. pdfimages extrait toutes les images d’un PDF dans leur format et résolution d’origine, y compris le support pour JPEG, JPEG2000 et d’autres formats. Il est largement recommandé pour les utilisateurs souhaitant un processus d’extraction gratuit et à haute fidélité.
Outils en ligne (par exemple, PDF24 Tools, PDFCandy, pdfforge) : Ces services permettent de télécharger un PDF et de télécharger les images extraites, en conservant la résolution d’origine. Ils sont pratiques pour des tâches rapides et n’exigent pas d’installation, mais peuvent soulever des préoccupations de confidentialité pour les documents sensibles.

Tableau récapitulatif

Logiciel/Outil	Plateforme	Préservation de la résolution d’origine	Notes
Adobe Acrobat Pro	Windows/Mac	Oui	Payant, professionnel, très fiable
pdfimages (Poppler)	Linux/Windows	Oui	Gratuit, open source, utilitaire en ligne de commande
PDF24 Tools, PDFCandy	Web-based	Oui	Gratuit, facile à utiliser, préoccupations de confidentialité

Point clé :
Utilisez toujours des outils qui extraient (et non rendent ou capturent) les images. À la fois Adobe Acrobat Pro et pdfimages sont des normes de l’industrie pour ce faire, assurant que les images sont enregistrées exactement telles qu’elles existent dans le PDF, sans perte de résolution.

Options de ligne de commande de pdfutils

Lors de l’exécution de pdfimages /help il affichera quelque chose comme :

$ pdfimages /help
pdfimages version 24.02.0
Copyright 2005-2024 The Poppler Developers - http://poppler.freedesktop.org
Copyright 1996-2011, 2022 Glyph & Cog, LLC
Utilisation : pdfimages [options] <PDF-fichier> <racine-image>
  -f <int>       : première page à convertir
  -l <int>       : dernière page à convertir
  -png           : changer le format de sortie par défaut en PNG
  -tiff          : changer le format de sortie par défaut en TIFF
  -j             : écrire les images JPEG en tant que fichiers JPEG
  -jp2           : écrire les images JPEG2000 en tant que fichiers JP2
  -jbig2         : écrire les images JBIG2 en tant que fichiers JBIG2
  -ccitt         : écrire les images CCITT en tant que fichiers CCITT
  -all           : équivalent à -png -tiff -j -jp2 -jbig2 -ccitt
  -list          : imprimer la liste des images au lieu de les sauvegarder
  -opw <string>  : mot de passe propriétaire (pour les fichiers cryptés)
  -upw <string>  : mot de passe utilisateur (pour les fichiers cryptés)
  -p             : inclure les numéros de page dans les noms des fichiers de sortie
  -q             : ne pas afficher aucun message ou erreur
  -v             : imprimer les informations de copyright et de version
  -h             : imprimer les informations d'utilisation
  -help          : imprimer les informations d'utilisation
  --help         : imprimer les informations d'utilisation
  -?             : imprimer les informations d'utilisation

Utilisation de l’outil pdfimages sous Linux : Instructions étape par étape