Come funziona OCR funziona?

October 7

Che cosa è l'OCR?

riconoscimento ottico dei caratteri, più comunemente conosciuto come OCR, è l'interpretazione delle immagini scansionate di testo scritto a mano, a macchina o stampati in testo che possono essere modificati su un computer. Ci sono vari componenti che lavorano insieme per eseguire il riconoscimento ottico dei caratteri. Questi elementi includono l'identificazione del modello, l'intelligenza artificiale e la visione artificiale. La ricerca in questo settore continua, lo sviluppo di velocità di lettura più efficace e una maggiore precisione.

I due sistemi principali utilizzati per eseguire OCR sono "matrice matching" e "estrazione di caratteristiche." Matrix matching è la più semplice e la più comune, così come il più limitato, dei due.

Matrix Corrispondenza

Matrix corrispondente (noto anche come pattern matching) associa ciò lo scanner percepisce come un carattere con un insieme di modelli memorizzati bitmap o contorni dei caratteri. Quando un'immagine corrisponde ad uno di questi bitmap selezionato all'interno di un certo grado di somiglianza, il programma identifica quell'immagine come carattere testo normale equivalente. Un difetto evidente di questo sistema è che può essere utilizzato solo per i caratteri e dimensioni nel suo repertorio.

Feature Extraction

estrazione delle caratteristiche è anche conosciuto come il riconoscimento intelligente dei caratteri (ICR), o l'analisi caratteristica topologica. Si tratta di una sorta di riconoscimento ottico dei caratteri che non si basa sulla corrispondenza precisa per impostare modelli. Il programma cerca gli elementi comuni come spazi aperti, chiusi forme, linee diagonali - e così via.