Estrarre immagini da file PDF

5 06 2009

Recentemente ho avuto necessità di recuperare delle foto che avevo usato in passato per creare un PDF, ma non essendo più in possesso delle immagini originali, l’unica soluzione possibile è stata quella di estrarre tutte le foto dal file PDF stesso.
Fortunatamente Linux ha tutti gli strumenti necessari per svolgere tale compito e nello specifico andremo ad usare: pdfimages, una delle PDF utility fornite dal pacchetto: Poppler-utils, che di norma è già presente in molte distro, ma nel caso così non fosse, sarà sufficiente installarlo attraverso il vostro gestore di pacchetti; ad esempio in Debian e derivate il tutto si risolve con:

# apt-get install poppler-utils [invio]

La velocità e la semplicità d’uso di pdfimages rende l’estrazione di immagini da file PDF un’operazione banale, però prima di iniziare è doveroso ricordare che le immagini estratte verranno salvate nella stessa directory da cui si esegue il comando, per cui è sempre consigliabile creare una cartella di lavoro, dove mettere il file PDF da elaborare e successivamente spostasi nella stessa cartella per eseguire i comandi. Tutto ciò perché altrimenti, al momento dell’estrazione i file immagine creati andrebbero a distribuirsi in tutta la vostra home. A questo punto non ci resta che toccare con mano la potenza di questo tool; con il seguente comando andremo ad estrarre tutte le foto incorporate nel PDF e le salveremo in tutti file che avranno come prima parte del nome: “toonik” seguito da un trattino, da un numero incrementale di tre cifre, un punto ed infine il suffisso del formato.

$ pdfimages file.pdf toonik [invio]

di default pdfimages estrae e salva le immagini in formato PBM (se in scala di grigi) e PPM (se a colori), quindi se vogliamo utilizzare un formato di salvataggio più leggero come il JPEG, dovremo utilizzare lo switch -j in questo modo:

$ pdfimages -j file.pdf toonik [invio]

abbiamo già detto che pdfimages estrae tutte le immagini dal file PDF, ma se noi volessimo estrarre solamente quelle presenti in alcune pagine? Niente paura, possiamo fare anche questo utilizzando le opzioni -f (first) e -l (last) per indicare la prima e l’ultima pagina da processare; quindi, nel caso volessimo ad esempio limitare l’operazione alle pagine: 3, 4 e 5; il comando precedente diventerebbe questo:

$ pdfimages -f 3 -l 5 -j file.pdf toonik [invio]

Infine ricordiamo che con questo tool è possibile lavorare anche su file PDF protetti, basta utilizzare le opzioni -opw o -upw seguite dalla password di protezione.

Ciao e… buona estrazione 🙂





Internet Explorer con Linux

31 03 2007

No, no, non avete capito male…

sto parlando proprio di lui il browser di casa Microsoft©.

Direte… e cosa ce ne facciamo di ie quando in Linux abbiamo ottimi browsers come Epiphany, Firefox, Konqueror ed altri ? Effettivamente non ha senso usare ie con Linux (aggiungo: neppure in Windows), solo che quando si ha necessità di testare un sito, occorre verificarne la corrispondenza anche in internet explorer…        ora, avendo depurato la mia casa da Windows©, non mi resta altra scelta, che installare ie su Linux.

Premetto che per ottenere lo stesso risultato ci sono diversi modi, ma poiché molti lettori di questi articoli sono amici alle prime armi, per raggiungere il nostro scopo adotteremo un approccio veloce ed indolore.

Bene prima di iniziare è necessario installare nel nostro sistema wine e cabextract, che nel caso abbiate una Debian o derivate, il tutto si riduce ad un semplice:

# apt-get install wine cabextract [invio]

– soddisfatte le dipendenze, aprite un terminale e digitate:
$ wget http://www.tatanka.com.br/ies4linux/downloads/ies4linux-latest.tar.gz [invio]
wget scaricherà nella cartella corrente il file ies4linux-latest.tar.gz

– decomprimetelo con:

$ tar xzvf ies4linux-latest.tar.gz [invio]

– entrate nella cartella creata dalla decompressione del file con:

$ cd ies4linux-xxx [invio]

dove xxx è il numero di versione – per vedere il contenuto della cartella usate:

$ ls -l [invio]

– ora non vi resta che eseguire lo script di installazione e seguire le istruzioni a video:

$ ./ies4linux [invio]

saranno poste alcune domande che vi consentiranno di installare in un sol colpo diverse versioni di internet explorer, il plug-in flash e la localizzazione in italiano.

Nel caso abbiate un desktop-manager tipo Gnome, verranno create le icone sul desktop, ma se come me usate prevalentemente un window-manager leggero sarà necessario avviare ie da terminale oppure creare un’ apposita voce di menu… a manina. Da riga di comando è sufficiente digitare:

$ /home/tuo_utente/bin/ie6 [invio]

$ /home/tuo_utente/bin/ie55 [invio]

$ /home/tuo_utente/bin/ie5 [invio]

per avviare i corrispondenti programmi

… ehmm dimenticavo, provate ad eseguire 3 differenti versioni di internet explorer in windows e fatemi sapere come è andata 🙂

Toonik