Come usare Apache PDFBox

March 25

Se pubblichi articoli, documenti o altre informazioni sul tuo sito web, i file PDF offrono un modo conveniente per i visitatori del tuo sito per scaricare e condividere i tuoi contenuti. Apache PDFBox è una libreria open-source gratuito, Java PDF utilizzato per la creazione di PDF e la manipolazione. la creazione di PDF e l'estrazione di testo sono tra le funzioni più basilari del programma. Imparare a utilizzare Apache PDFBox è relativamente semplice, che consente di compilare i documenti PDF per il tuo sito in un breve periodo di tempo.

istruzione

Creazione PDF - Pagina vuota

1 Creare un documento PDF vuoto digitando il seguente codice flusso in una sola riga: "documento = new PDDocument ();" (Non includere le virgolette quando si digita uno dei codici di flusso).

2 Aggiungere una pagina al documento PDF vuota digitando il seguente comando su una riga separata: "PDPage blankPage = new PDPage ();" premere "Invio" sulla tastiera e scrivere la riga successiva di codice una propria linea, "document.addPage (blankPage) ;."

3 Salvare il file PDF vuoto e usarlo come modello per la creazione di file PDF in futuro digitando la seguente riga di comando su di essa la propria linea: "document.save (" BlankPage.pdf ") ;."

4 Chiudere il documento per renderlo permanente digitando la seguente riga di comando: "document.close () ;."

Creazione PDF - File con testo

5 Aprire il modello di file PDF vuoto appena creato e riempirlo con testo modificando e aggiungendo poche righe di codice. Sulla seconda riga di codice, "PDPage blankPage = new PDPage ();" cambiamento "blankPage" a "pagina."

6 Premere il tasto "Invio" sulla tastiera per passare alla riga successiva e aggiungere la seguente riga di codice: "document.addPage (pagina) ;."

7 Premere il tasto "Invio" sulla tastiera e creare una descrizione di carattere utilizzando il tipo di font standard PDF scrivendo la seguente riga di codice: "font PDFont = PDType1Font.HELVETICA_BOLD ;."

8 Premere il tasto "Invio" sulla tastiera e creare un flusso di contenuto digitando la seguente riga di comando: "PDPageContentStream contentStream = new PDPageContentStream (documento, pagina) ;."

9 Premere il tasto "Invio" sulla tastiera e definire il contenuto, tipo di carattere e la posizione del testo digitando le seguenti righe di comando: "contentStream.beginText (); contentStream.setFont (tipo di carattere, 12); contentStream.moveTextPositionByAmount (100, 700); contentStream.drawString ( "Digitare il testo qui"); contentStream.endText (); " premere "Invio" sulla tastiera dopo ogni virgola.

10 Chiudere la linea di flusso contenuti digitando la seguente riga di comando "contentStream.close () ;."

11 Aggiungere il titolo del file PDF nella riga di comando salvare il documento, "document.save (" BlankPage.pdf ");" sostituendo "BlankPage" con il proprio nome di file.

12 Mantenere la linea di stretto documento è quello di mantenere il documento sigillato.

PDF Text estrazione da file PDF esistente

13 Apri PDF Box e digitare la seguente riga di comando per trasformare un file PDF esistente in un semplice documento di testo: "Documento luceneDocument = LucenePDFDocument.getDocument (inserire il nome del file PDF qui) ;."

14 Estrarre il testo è necessario dal file PDF dal semplice documento di testo evidenziandolo, fare clic sul pulsante del mouse "Destra" e selezionare "Copia" dal menu. Incollare il testo estratto in un documento facendo clic sul pulsante del mouse "Destra" e selezionando "Incolla" dal menu.

15 Estrarre una specifica linea di testo immediatamente da un file PDF esistente digitando le seguenti righe di comando: "PDFTextStripper spogliarellista = new PDFTextStripper (); stripper.setStartPage (specificare pagina iniziale qui, per esempio, 16); stripper.setEndPage (specificare pagina finale qui, per esempio, 23); stripper.writeText (...); premere "Invio" sulla tastiera dopo ogni punto e virgola.

Consigli e avvertenze

  • La procedura di cui sopra funziona con PDFBox versione 1.8.5. Il processo può essere uguale o leggermente variare nelle versioni precedenti.