Che cosa è il software di riconoscimento ottico dei caratteri?

June 6

La possibilità di eseguire la scansione di un documento in forma leggibile dalla macchina è un risparmio di tempo ineguagliabile. Invece di riscrivere il documento, e, eventualmente, inserendo gli errori del proprio, la scansione e passando l'immagine acquisita attraverso un lettore software può risultare in un documento modificabile con un alto grado di precisione rispetto a quello originale. Questo processo software si chiama riconoscimento ottico dei caratteri.

Riconoscimento ottico dei caratteri

riconoscimento ottico dei caratteri (OCR) è un processo in cui stampato o testo scritto a mano è meccanicamente o elettronicamente leggere e convertito in una forma riconosciuta da un computer. Il sofisticato processo vede la forma delle lettere e li confronta con una libreria di forme simili. Quando si fa una corrispondenza, viene visualizzato un carattere che rappresenta il modello sullo schermo, o inserito in un file di computer. OCR rende possibile per un documento da sottoporre a scansione e letta da un computer, la creazione di un file che può essere modificato o agito su in altri modi.

Software OCR

Software è utilizzato per esecuzione moderna OCR. Il software ha avanzato dai suoi primi giorni, in cui i programmi dovevano essere calibrato per ogni tipo di carattere unico ci si aspettava da riconoscere. È disponibile in forma standalone come programma creato appositamente per l'attività, e come componente in software di scansione. L'avvento di Internet e il cloud computing ha portato allo sviluppo di programmi OCR basati sul Web, eliminando la necessità di singoli desktop o server installazioni.

Il processo di riconoscimento

funzioni del software OCR per primo riconoscere la distinzione tra zone chiare e scure dell'immagine digitalizzata. Come si scopre una distinzione chiaro-scuro, il software cerca i modelli riconoscibili, come linee verticali e orizzontali, nonché curve collegate o parziali. Se è in grado di riconoscere un modello come una lettera o un altro carattere, cerca il suo database per il personaggio corrispondente nella lingua impostata del computer. Si passa quindi questo personaggio al documento o visualizzarlo sta assemblando. Se il software è in grado di riconoscere un carattere, può effettuare la propria ipotesi migliore o sostituire un carattere alternativo per mantenere il processo in corso.

Potenziali problemi con il software OCR

Poiché il software OCR si basa sul riconoscimento del modello, qualsiasi manufatto sulla pagina che potrebbero influenzare questo processo è fonte di problemi. OCR funziona meglio quando c'è una chiara distinzione tra i personaggi e lo sfondo del documento, idealmente nero su bianco. Colorato o sfondi occupato che rendono i modelli distintivo è inferiore può causare problemi. Macchie, pieghe e altri danni al documento possono provocare riconoscimento dei caratteri non corretti pure.