Come convertire un file PDF in HTML con Ubuntu

May 23

Come convertire un file PDF in HTML con Ubuntu


Ci sono diversi modi per tentare la modifica di un file PDF in un formato HTML. Tenete a mente, il prodotto finito probabilmente non guardare buono come l'originale. Il Portable Document Format non è facilmente aggirata. HTML non funziona con testo e immagini in tutto allo stesso modo in cui i file PDF fanno, soprattutto quelli complessi, ma qui ci sono alcuni modi per tentare esso.

istruzione

3 Metodi

1 Il modo più semplice è quello di andare al sito Web di Adobe e caricare il PDF. Probabilmente a causa della valanga di software commercializzato a fare questa cosa molto, Adobe offre gratuitamente. Tutto quello che dovete fare è compilare in pochi spazi vuoti, fare clic su un pulsante e il gioco è fatto.

http://www.adobe.com/products/acrobat/access_onlinetools.html

2 Un altro modo è quello di usare un po 'ingegnoso strumento chiamato ImageMagick. E 'facile da trovare in Synaptic. Scaricatelo, sceglierlo dal "aperto con" menù, e "salva come" html. L'unica hang-up con esso è che si può fare solo una pagina alla volta.

3 L'ultimo modo è quello di utilizzare un piccolo programma chiamato pdftohtml. Per fare questo è necessario utilizzare il terminale per assicurarsi Poppler-utils è installato.

sudo aptitude install Poppler-utils

Il programma verrà installato automaticamente, e poi si deve passare alla directory in cui si trova il file PDF. Una volta lì, tutto quello che dovete fare è digitare:

pdftohtml -c [nome del file] .pdf [nome del file] .html

Il prodotto finito non è molto diverso da quello che si proposta dal sito Web di Adobe, ma sarete sostiene il software open source usandolo!

Consigli e avvertenze

  • L'unico altro modo (e il migliore) è quello di estrarre il testo (di solito è possibile copiare e incollare) e poi le immagini nel vostro editor HTML preferito, come NVU o anche un documento di testo in OpenOffice.org. Una volta che è tutto posizionato nel modo desiderato, è possibile "salva come" un HTML o XHTML. Si otterrà un prodotto meglio rifinito, ma sarà quasi essere ricreare il volante mentre si è in esso. Se si utilizza The Gimp, è possibile salvare il PDF come immagine. Anche il testo diventa parte dell'immagine. Ma si potrebbe quindi inserire il tutto in un documento HTML.
  • Non è un processo in un unico passaggio, spesso, e non è sempre bella, ma questi metodi di lavoro. A meno che i file PDF sono molto complesse, si dovrebbe ottenere un prodotto finito utilizzabile.