Come analizzare i documenti PDF in Java

March 25

I file PDF forniscono un formato standard per aprire a livello di programmazione e di analizzare i dati da un documento di sola lettura. È possibile utilizzare le librerie Java PDF per aprire un documento e leggere le informazioni contenute all'interno. O si memorizzano le informazioni in un database o di visualizzare le informazioni di nuovo al lettore nella vostra applicazione Java.

istruzione

1 Fare clic sul file Java che si desidera utilizzare per analizzare le informazioni in formato PDF. Fai clic su "Apri con" e selezionare l'editor Java.

2 Importare la libreria lettore PDF. Aggiungere il seguente codice nella parte superiore del file di Java per importare la libreria:

import com.asprise.util.pdf.PDFReader;

3 Aprire il file PDF. Il parser si trova nella classe "PdfReader" nella biblioteca appena aggiunto. Aggiungere il seguente codice alla funzione che si desidera utilizzare per analizzare il file, sostituendo "thepdf.pdf" con il proprio nome di file PDF:

PdfReader pdf = new PdfReader (new File ( "thepdf.pdf"));
pdf.open ();

4 Analizzare il testo dal file PDF. Il codice seguente analizza il contenuto da una pagina nel PDF:

String dei documenti in PDF = pdf.extractTextFromPage (0);

Sostituire il "0" con il numero della pagina che si desidera estrarre dal file. La prima pagina inizia a 0, in modo da ciascun indice pagina aggiuntiva è il numero della pagina che si desidera estrarre meno 1 per compensare l'offset.

5 Chiudere il file dopo aver completato l'analisi dei dati. Il codice seguente chiude il file:

pdf.close ();