Come usare Tesseract OCR in Java

March 23

biblioteche riconoscimento ottico dei caratteri Tesseract offrono agli sviluppatori un metodo per la scansione di documenti e testi a un'immagine. È possibile utilizzare le librerie Tesseract per memorizzare le immagini di documenti che è necessario non è più in formato cartaceo. È possibile utilizzare le librerie Tesseract in Java da loop attraverso ogni personaggio e scrivendo il carattere in un file. Per utilizzare le librerie, è necessario includere il namespace Java per le funzioni OCR.

istruzione

1 Fare clic sul file Java che si desidera utilizzare per creare il documento OCR. Fai clic su "Apri con" e selezionare il vostro editor preferito Java.

2 Aggiungere la libreria namespace OCR nella parte superiore del file. Copiare e incollare il seguente codice al file di codice sorgente:

com.tplan.robot.imagecomparison.tesseractocr

3 Creare il codice che esegue la scansione caratteri al file. Per esempio, il codice seguente scorre ciascun carattere in un file e lo scrive un file di immagine:

Linee var = 0
CompareTo method = cmparea "tocr" = "x: 33, y: 2, w: 200, h: 22"
for (i = 1; {i} <{linee} +1; i = {i} +1) {
Typeline "{_TOCR_LINE {i}}"
}

4 Fare clic sul pulsante "Salva" del redattore Java e fare clic su "Esegui" per eseguire il codice in un debugger Java.