June 6
La possibilità di eseguire la scansione di un documento in forma leggibile dalla macchina è un risparmio di tempo ineguagliabile. Invece di riscrivere il documento, e, eventualmente, inserendo gli errori del proprio, la scansione e passando l'immagine acquisita attraverso un lettore software può risultare in un documento modificabile con un alto grado di precisione rispetto a quello originale. Questo processo software si chiama riconoscimento ottico dei caratteri.
riconoscimento ottico dei caratteri (OCR) è un processo in cui stampato o testo scritto a mano è meccanicamente o elettronicamente leggere e convertito in una forma riconosciuta da un computer. Il sofisticato processo vede la forma delle lettere e li confronta con una libreria di forme simili. Quando si fa una corrispondenza, viene visualizzato un carattere che rappresenta il modello sullo schermo, o inserito in un file di computer. OCR rende possibile per un documento da sottoporre a scansione e letta da un computer, la creazione di un file che può essere modificato o agito su in altri modi.
Software è utilizzato per esecuzione moderna OCR. Il software ha avanzato dai suoi primi giorni, in cui i programmi dovevano essere calibrato per ogni tipo di carattere unico ci si aspettava da riconoscere. È disponibile in forma standalone come programma creato appositamente per l'attività, e come componente in software di scansione. L'avvento di Internet e il cloud computing ha portato allo sviluppo di programmi OCR basati sul Web, eliminando la necessità di singoli desktop o server installazioni.
funzioni del software OCR per primo riconoscere la distinzione tra zone chiare e scure dell'immagine digitalizzata. Come si scopre una distinzione chiaro-scuro, il software cerca i modelli riconoscibili, come linee verticali e orizzontali, nonché curve collegate o parziali. Se è in grado di riconoscere un modello come una lettera o un altro carattere, cerca il suo database per il personaggio corrispondente nella lingua impostata del computer. Si passa quindi questo personaggio al documento o visualizzarlo sta assemblando. Se il software è in grado di riconoscere un carattere, può effettuare la propria ipotesi migliore o sostituire un carattere alternativo per mantenere il processo in corso.
Poiché il software OCR si basa sul riconoscimento del modello, qualsiasi manufatto sulla pagina che potrebbero influenzare questo processo è fonte di problemi. OCR funziona meglio quando c'è una chiara distinzione tra i personaggi e lo sfondo del documento, idealmente nero su bianco. Colorato o sfondi occupato che rendono i modelli distintivo è inferiore può causare problemi. Macchie, pieghe e altri danni al documento possono provocare riconoscimento dei caratteri non corretti pure.