Gli svantaggi di OCR

November 11

Gli svantaggi di OCR


Il servizio postale degli Stati Uniti utilizza la tecnologia di riconoscimento ottico dei caratteri (OCR) per leggere gli indirizzi su pezzi di posta elettronica. Per la posta elettronica per essere leggibile da un messaggio di posta sorter OCR, tuttavia, gli indirizzi ei caratteri devono essere formattati in un certo modo. software OCR è utile per convertire immagini scansionate di documenti digitati o scritti a mano in testo elettronico ricercabile, ma ha degli svantaggi che limitano le sue applicazioni.

Documenti limitati

OCR funziona meglio con buona qualità digitato documenti. Documenti scritti a mano non possono essere facilmente letti da un software OCR. Allo stesso modo, i caratteri digitati che assomigliano scrittura a mano - così come caratteri non latini - creare molti errori durante il processo OCR. Se il documento è scarso contrasto, è sgualcita o sporco, o il testo e lo sfondo sono simili nel buio, poi OCR non può funzionare bene. OCR ha difficoltà con i documenti che hanno entrambe le immagini e testo. Fogli di calcolo potranno anche produrre più errori.

Precisione

Nessun software OCR è al 100 per cento accurate. Il numero di errori dipende dalla qualità e dal tipo di documento, inclusi il carattere utilizzato. Gli errori che si verificano durante l'OCR includono lettere letture sbagliate, saltando lettere che sono illeggibili, o mescolando insieme il testo da colonne adiacenti o didascalie delle immagini. Se è richiesta un'elevata precisione - come con la conversione di libri digitali in formato elettronico - poi un clean-up del testo elettronico sarà necessario.

Work-around

OCR ha difficoltà a distinguere tra caratteri, ad esempio il numero zero e un capitale "O." Per ovviare a questo, un carattere speciale OCR può essere utilizzato, come ad esempio la scrittura di zero. Tuttavia, questo funziona solo per i documenti creati con OCR in mente, come i questionari. Durante la creazione di questionari che saranno scritti a mano, i ricercatori utilizzano anche scatole per ogni lettera.

Lavoro extra

Anche se l'immagine digitalizzata del documento originale è di alta qualità, devono verificarsi ulteriori passaggi per ripulire il testo OCR. È molto laboriosa per correggere gli errori creati da OCR. Una persona deve confrontare manualmente il documento originale e il testo elettronico. Persone anche fare errori durante la digitazione di testo da un documento, ma a volte è più veloce per saltare la fase OCR.