Extraire des pages de PDF dans Linux

Extraire des pages de PDF dans Linux
Traiter avec les fichiers PDF peut parfois être assez compliqué car ils ne sont pas très modifiables. Souvent, il faut extraire une poignée de pages spécifiques d'un énorme document, et toute la course peut sembler très laborieuse. C'est exactement pourquoi nous consacrerons ce tutoriel pour vous montrer les meilleures méthodes et les meilleurs outils dont vous avez besoin pour extraire des pages de fichiers PDF dans Linux.

Utilisation d'un outil en ligne

Les fichiers PDF sont devenus l'un des moyens les plus courants de documenter et de distribuer des données. En raison de leur popularité, de nombreux sites Web et programmes sont conçus particulièrement pour manipuler ces fichiers. En parlant de cela, IlovePDF est un site Web entièrement consacré à cet objectif. Il dispose de nombreux outils que vous pouvez utiliser gratuitement pour diviser, fusionner, convertir, organiser, protéger et compresser les fichiers PDF.

Puisque nous voulons extraire des pages de fichiers PDF, nous utiliserons l'outil de séparateur PDF offert par le site Web comme mentionné ci-dessus. Une fois que vous avez le document PDF dont vous souhaitez extraire des pages, cliquez ici pour visiter l'outil de séparation PDF en ligne.

Cliquez sur le bouton Sélectionner le fichier PDF et accéder à votre document. Une fois que vous l'avez téléchargé, vous pouvez sélectionner si vous souhaitez extraire des pages ou diviser le fichier par plage.

Allez-y et sélectionnez les options dont vous avez besoin dans les boutons du côté droit. Une fois que vous avez terminé, cliquez sur le PDF divisé, et ce devrait être. Il initialisera le téléchargement d'un .Fichier zip qui contient vos pages extraites.

ILovePDF a également une application téléchargeable gratuite, mais malheureusement, il n'est disponible que pour Windows et MacOS. Cependant, cela n'enlève pas sa capacité à vous aider à extraire des pages de PDF sur Linux car vous pouvez également l'utiliser en ligne. Cela étant dit, vous pouvez désormais utiliser un outil de fractionnement PDF en ligne complètement gratuit pour sélectionner des pages spécifiques dans les fichiers PDF et les extraire sans aucun problème!

Utilisation de PDFSHUFFLER

Si pour une raison quelconque - cela peut être dû à des problèmes de confidentialité ou à un manque de fonctionnalité - la méthode précédente ne vous a pas convaincu, pas de vous inquiéter, car nous avons des recommandations plus favorables pour vous d'essayer.

L'un d'eux est PDFSHuffler, une application Python-GTK pratique qui permet à ses utilisateurs de manipuler facilement les fichiers PDF. Ses fonctionnalités incluent la fusion, le fractionnement, le recadrage, la rotation et le réarrangement des fichiers PDF. L'outil ajoute à sa fonctionnalité étendue via son interface graphique facile à pousser et intuitive.

Vous pouvez cliquer ici pour télécharger PDFSHUFFLER à partir de Source Forge, ou vous pouvez le faire à l'ancienne à travers la ligne de commande. Accédez au menu Activités ou appuyez sur Ctrl + Alt + T sur votre clavier pour ouvrir une nouvelle fenêtre de terminal.

Après avoir fait cela, exécutez les commandes ci-dessous vers le premier vérification des mises à jour, puis installez PDFSHUFFLER sur votre système Linux. (Ces commandes sont pour Ubuntu 20.04, mais d'autres versions ne devraient pas être trop différentes de celles-ci).

$ sudo apt mise à jour
$ sudo apt install pdfShuffler

Une fois l'installation terminée, trouvez le logiciel nouvellement installé dans le menu Activités et exécutez-le. L'écran par défaut devrait ressembler à l'image ci-dessous.

L'étape suivante consiste à saisir votre fichier PDF dans le programme en cliquant sur le bouton Fichier et en sélectionnant l'option Ajouter dans le menu déroulant.

Une fois terminé, configurez vos paramètres d'extraction et divisez le fichier. La sortie doit vous donner les pages extraites souhaitées du document d'entrée.

Utilisation de PDFTK

Si vous avez une appréciation particulière pour les programmes de ligne de commande plutôt que ceux avec des interfaces graphiques, alors PDFTK est la voie à suivre. Il s'agit d'une solution CLI efficace pour les utilisateurs qui ont besoin d'extraire des pages spécifiques à partir de fichiers PDF. Laissez-nous voir comment vous pouvez l'installer sur diverses distributions Linux et comment l'utiliser.

Retournez dans votre fenêtre de terminal ou ouvrez-en un nouveau et exécutez les commandes suivantes si vous utilisez Ubuntu ou Debian.

$ sudo apt install pdftk

Cependant, si vous n'avez pas activé le référentiel d'univers, la commande mentionnée ci-dessus ne fonctionnera pas. Vous pouvez activer ce référentiel en exécutant la commande ci-dessous.

$ sudo add-att-repository univers

Après avoir fait cela, revenez à la première commande pour installer PDFTK.

Si vous utilisez Arch Linux ou l'une de ses variantes, exécutez la commande ci-dessous. (PDFTK est facilement accessible via le référentiel communautaire).

$ Pacman -s pdftk

De même, si vous êtes sur OpenSUSE, exécutez la commande ci-dessous pour installer PDFTK.

$ sudo zypper installer pdftk

Enfin, si vous avez activé SNAP, vous pouvez également obtenir cet outil via une commande SNAP.

$ sudo snap installer pdftk

Ensuite, jetons un coup d'œil à l'utilisation de PDFTK. Comme nous l'avons mentionné plus tôt, il s'agit d'un outil CLI, donc tout ce que vous avez à faire est d'exécuter une petite commande pour obtenir ce dont vous avez besoin.

$ PDFTK Entrée.PDF CAT 3-4 OUTPUT OUTPUT_P3-4.pdf

Maintenant, ce qui se passe dans cette commande? Premièrement, entrée.PDF est le document qui doit être divisé. Le paramètre 3-4 spécifie la plage de numéros de page, 3 à 4. Ensuite, nous avons le nom de fichier de sortie, qui est Output_P3-4.pdf. Assez simple, et vous devriez le comprendre en un rien de temps.

Cependant, vous ne cherchez peut-être pas à diviser un fichier PDF par une plage de numéro de page; Extraire un tas de pages particulières dans des fichiers PDF séparés. Ne vous inquiétez pas, comme vous pouvez également le faire via cet outil. Tout ce que vous avez à faire est de faire un léger changement dans la commande que nous avons mentionnée plus tôt. Ce changement est illustré ci-dessous.

$ PDFTK Entrée.PDF Cat 3 4 Sortie de sortie.pdf

Avec cela, vous pouvez diviser les pages 3 et 4 et les enregistrer sous forme de sortie.pdf.

Conclusion

Dans ce guide, nous avons pris une grande profondeur sur la façon dont vous pouvez extraire les pages des fichiers PDF. Nous avons examiné un outil en ligne pratique, puis un programme basé sur l'interface graphique téléchargeable, et enfin, une solution en ligne de commandement. Les outils mentionnés ci-dessus sont riches en termes de fonctionnalités et devraient faire le travail facilement.