Come leggere i file PDF in .NET

September 10

I file PDF sono utilizzati dalle aziende per distribuire le informazioni in un formato di sola lettura. Si utilizza .NET C # per leggere un PDF e visualizzarlo per gli utenti. Questo fornisce un'interfaccia, quindi gli utenti non hanno bisogno del software Adobe PDF sul computer per visualizzare i file. Per leggere i file PDF in .NET C #, si crea una variabile di documento e utilizzare le funzioni di variabile per estrarre il testo.

istruzione

1 Creare la variabile del documento. La variabile documento si apre un file PDF e lo assegna alla variabile C #. Il seguente codice è come si crea la variabile:

Documento luceneDocument = LucenePDFDocument.getDocument ( "c: \ file.pdf");

Sostituire "c: \ file.pdf" con il proprio percorso di file PDF.

2 Assegnare il contenuto PDF a una variabile. La funzione "PDFTextStripper" prende il testo da una pagina PDF specificato e lo colloca in una variabile. Utilizzare il seguente codice per leggere il file:

PDFTextStripper content = new PDFTextStripper ();
content.setStartPage (2);
content.setEndPage (3);

3 Scrivere il testo PDF in una pagina web. Il codice seguente scrive tutto il testo da pagina 2 a pagina 3 alla pagina web:

stripper.writeText ();

Consigli e avvertenze

  • È inoltre possibile utilizzare la classe "PDFTextStripper" per leggere e modificare il testo nel file PDF.