2015 25/09

Come Estrarre Immagini da PDF con Linux

  • Scritto da Claudia Falzone
  • 0 com
  • Categoria: Guide, Linux

Estrarre il testo da un PDF con Linux è molto semplice: basta usare il comando pdftotext. Allo stesso modo con il comando pdfimages è possibile estrarre le immagini contenute in un PDF e salvarle come file. Ovviamente non è detto che nella distribuzione che stiamo usando siano presenti questi due comandi: fanno parte del pacchetto poppler-utils. Per installarli occorre utilizzare il comando sudo “apt-get install poppler-utils” da riga di comando. Dopo aver installato questo pacchetto è possibile cominciare immediatamente a estrarre testo e immagini da PDF con Linux. In questa guida vedremo rapidamente come fare, che trucchi utilizzare per ottenere i risultati migliori e, infine, come velocizzare il tutto. Ma andiamo con ordine e partiamo dalla situazione più semplice, quella con tutte le impostazioni predefinite.

Estrarre immagini da PDF

Comando pdfimages usato su Linux per estrarre immagini da PDF

Cominciamo con l’estrarre tutte le immagini da un file PDF. Apriamo la riga di comando con CTRL + ALT + T e scriviamo:

pdfimages NomeDelPDF CartellaDoveSalvareLeImmagini

Ovviamente sostituiamo a NomeDelPDF il nome e la posizione del PDF da cui vogliamo estrarre le immagini. E al posto di CartellaDoveSalvareLeImmagini la posizione dove vogliamo che vengano salvate le immagini estratte.

Per impostazione predefinita le immagini vengono salvate con il nome 000 per la prima, 001 per la seconda, 003 per la terza e così via.

File delle immagini estratte da PDF

Se vogliamo ottenere un nome più facile possiamo usare questo comando:

pdfimages NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Se, per esempio, sostituiamo a NomeImmagine con la parola “image” otterremo image-000, image-001, image-003 e così via.

Schermata del comando Linux per salvare le immagini estratte in formato JPG

Le immagini vengono salvate nel formato PPM (portable pixmap) o PBM (portable bitmap). Se vogliamo forzare il salvataggio come JPEG ci basta inserire “-j” prima del nome del PDF:

pdfimages -j NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

In questo modo otterremo image-000.jpg, image-001.jpg, image-002.jpg e così via.

File delle Immagini salvate in formato JPG

Per ottenere invece immagini PNG basta usare l’opzione “-png”:

pdfimages -png NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

e per i file TIFF, “-tiff”:

pdfimages -tiff NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Comando Linux per estrarre le immagini da PDF a partire da una certa pagina

Per estrarre le immagine dopo una certa pagina si utilizza l’opzione “-f” seguita dal numero della prima pagina da cui far partire l’operazione. Per esempio per estrarre le immagini da pagina 3 in poi usiamo il comando:

pdfimages -f 3 NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Invece per estrarre le immagini prima di una certa pagina si utilizza l’opzione “-l” (attenzione, è la lettera L minuscola, non il numero 1), sempre seguita da un numero. In questo caso il numero rappresenta l’ultima pagina da cui estrarre le immagini. Così, se vogliamo estrarre le immagini della pagina 1, della pagina 2 e della pagina 3 scriviamo:

pdfimages -l 3 NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Queste due opzioni possono essere abbinate a quelle che indicano il tipo di immagine da salvare. Così, se vogliamo salvare come JPEG le prime tre pagine del PDF possiamo scrivere

pdfimages -l 3 -j NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Ovviamente si può fare lo stesso per ottenere TIFF e PNG.

Comando Linux per estrarre immagini da un PDF protetto da password

Infine, se il PDF è protetto da password è possibile comunque estrarne le immagini. Basta usare l’opzione “-opw” seguita dalla password. Come in questo esempio:

pdfimages -opw ‘password’ NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Ovviamente anche questa opzione può essere combinata con le altre, in questo modo:

pdfimages -opw ‘password’ -l 3 -j NomeDelPDF CartellaDoveSalvareLeImmagini/NomeImmagine

Infine, una piccola nota: a volte oltre alle immagini vengono salvate anche delle pagine bianche. Non c’è nessuno problema a eliminarle dopo aver tutte le operazioni.

Loading...

Lascia un commento

Copyright 2009-2017 CreaGratis.com


I contenuti di questo blog, dove non diversamente specificato, sono distribuiti sotto Licenza Creative Commons.

Creagratis non è collegato ai siti recensiti e non è responsabile per i loro contenuti.

Privacy policy | Blogmap | Contatti
P.IVA 02618720649