OCR Documenti ed errori TIFF

March 11

OCR Documenti ed errori TIFF


Il Tagged Image File Format, o TIFF, serve come una scelta frequente per il salvataggio dei file bitmap non compressi, comprese le immagini acquisite dal materiale scansione stampato. È possibile creare file TIFF ed eseguire il riconoscimento ottico dei caratteri sulle pagine del tipo che si desidera catturare come testo dal vivo. Se il file TIFF non soddisfa le specifiche OCR, il software OCR viene visualizzato un messaggio di errore che avvisa che il file non può essere elaborato correttamente o affatto.

TIFF compressione

Il formato di file TIFF consente di applicare la compressione delle immagini senza perdita di dati quando si salva i documenti in un programma software che incorpora il supporto per gli schemi di compressione dei file. Queste opzioni possono diminuire la dimensione del file, ma non tutti i programmi OCR supportare tutti, o qualsiasi, tipi di compressione TIFF. Per ottenere i migliori risultati, salvare i TIFF senza compressione per renderli più facili da usare come possibile.

Bassa risoluzione

Se si ha familiarità con la risoluzione utilizzata per le bitmap nelle pagine Web, si potrebbe chiedere perché un file di 72 pixel per pollice che guarda bene quando si visualizza in un browser Web produce risultati di scarsa qualità nel programma OCR. Questo perché il software OCR ha bisogno di un file che dedica abbastanza pixel per ogni carattere di testo per renderlo riconoscibile dagli algoritmi che elaborano le scansioni. Per ottenere i migliori risultati, è necessario almeno una scansione di 150 ppi, se non superiore. Apertura di una scansione a 72 ppi e ricampionamento a 300 ppi fa solo il file più grande senza migliorare la qualità delle immagini. Per ottenere risultati ottimali, iniziare con una nuova scansione ad alta risoluzione o per raggiungerlo.

Immagini Crooked

È difficile impostare un foglio di carta sul ponte di imaging di un scanner senza il foglio deriva un po 'storto sulla superficie in vetro. I momenti si spende riposizionare il foglio in modo da poter ottenere una scansione di buona qualità pagare in migliori risultati OCR. Anche una scansione storto nitide e perfette mette a dura prova più sul programma OCR che uno che ha catturato verso l'alto e verso il basso. Per ottenere i migliori risultati, abbassare il coperchio dello scanner lentamente in modo movimento dell'aria non disturbare la carta.

altre considerazioni

A seconda del programma OCR si utilizza, è possibile riscontrare i messaggi di errore perché i file TIFF utilizzano una modalità colore che il software OCR non supporta. Ad esempio, se hai catturato un-alta risoluzione, file RGB a 16 bit per l'utilizzo in un progetto di ritocco, il programma OCR può esitano a la dimensione del file o la sua profondità di bit. Le scansioni di pagine che includono fotografie o disegni rivelarsi problematico per alcuni software OCR, che possono presentare un messaggio di errore che riflette il contenuto della pagina, non il formato di file. Infine, se la scansione rappresenta il testo su un foglio di carta colorati, si possono avere problemi catturare il testo perché manca un sufficiente contrasto contro il suo sfondo.


Articoli Correlati