Come convertire un PDF in testo su Ubuntu

January 23

Portable Document Format file (PDF) sono diventati un formato di documento standard che può essere utilizzato ogni volta che l'editore di un documento vuole garantire che il layout generale del documento e guardare rimarrà lo stesso in tutti i computer. Tuttavia, a volte possono essere un fastidio per l'utente finale rispetto ai normali file di testo, così esistono programmi di utilità per la conversione da PDF a testo su Ubuntu.

istruzione

1 Aprire il terminale facendo clic sull'opzione "Applicazioni" nella barra dei menu, poi "Accessori" e poi "Terminale". Si aprirà il terminale a riga di comando di Ubuntu, l'equivalente Linux di Windows dei comandi DOS schermata del prompt.

2 Digitare il seguente comando nel terminale:

file.pdf pdftotext

Sostituire "file.pdf" con il nome del file PDF. Un file TXT con lo stesso nome verrà creato nella directory corrente.

3 Digitare quanto segue per stampare il testo risultante:

cat file.txt

Assicuratevi di controllare i risultati. Conversione da PDF a TXT è inesatta nella migliore delle ipotesi, e mentre di solito funziona, a volte il file di testo risultante è danneggiato.

Consigli e avvertenze

  • Ci sono decine di opzioni "pdftotext" disponibili per permettere di specificare esattamente come la conversione viene eseguito. Tipo "uomo pdftotext" nel vostro terminale per vedere queste opzioni.
  • Il vostro successo in conversione da PDF a testo varierà con ogni file PDF. A seconda del layout del file PDF, che può rivelarsi molto bene o il testo può essere irrimediabilmente confuso. Controllare sempre i risultati da soli prima di distribuire elettronicamente un file di testo convertito da un PDF.
  • Tutti i sistemi sono dotati di Ubuntu "pdftotext" installato come parte del pacchetto "Poppler-utils". Questo pacchetto è installato di default sui sistemi Ubuntu, ma se non è installato sul vostro, è possibile reinstallarlo digitando "sudo apt-get install poppler-utils" nel vostro terminale.