Le sfide di riconoscimento della grafia

September 16

Le sfide di riconoscimento della grafia


i programmi di riconoscimento della scrittura sono programmi per computer progettati per leggere i documenti scritti a mano. Tali programmi attualmente non hanno un alto grado di precisione. lettori umani costantemente fuori eseguire i programmi per elaboratore in lettura scrittura a mano. Un certo numero di difficoltà di ottenere nel modo di utilizzare un programma per computer per questo compito. Queste difficoltà sono aggravate nel caso di araba grafia e nell'analisi di documenti storici.

Problemi con il riconoscimento della grafia

Problemi con riconoscimento della scrittura includono il fatto che ogni persona ha uno stile unico di scrittura, il fatto che non vi è determinata quantità di spazio tra le parole e le difficoltà causate dalle immagini povere del testo originale. Per un computer per essere in grado di leggere un testo scritto a mano con precisione, avrebbe bisogno di essere in grado di riconoscere ogni possibile variazione su una lettera particolare, per determinare l'inizio e la fine delle parole, anche quando corrono insieme, e leggere parole anche quando sono sbiaditi. Quando il computer è dato contesto del campione prima del tempo, e quando il vocabolario è limitato a un elenco insieme di possibili parole, alcuni programmi sono stati relativamente efficace.

Il vantaggio umana

lettori umani possono sempre leggere scrittura a mano con più precisione rispetto ai programmi per computer, anche se si trovano ad affrontare le stesse sfide delle variazioni di scrittura personale, spaziatura delle parole e la qualità dell'immagine. Secondo i ricercatori Amalia Rusu e Venu Govindaraju, lettori umani sono in grado di applicare una Gestalt o approccio olistico, in cui una impressione generale vaga di una particolare parola gioca un ruolo più grande di qualsiasi tipo di analisi sistematica formale. Gestalt pensiero è difficile per qualsiasi programma per computer a causa della sua natura non sistematica.

Scrittura a mano araba

la scrittura araba è considerato un problema particolarmente impegnativo per i programmi di riconoscimento della scrittura. Una più ampia gamma di possibili forme dei caratteri è trovato in scrittura araba. Inoltre, le vocali sono talvolta lasciati fuori scrittura araba, e il lettore si prevede di riempirli conoscendo il contesto della parola. Tuttavia, non esiste una regola dura e veloce per quando devono essere omessi vocali e quando non dovrebbero. Il risultato è che non esiste un modo sistematico per dire al computer se una parola dovrebbe avere una vocale in un determinato luogo o meno.

testi storici

Biblioteche, musei e collezioni private in possesso di grandi quantità di lettere e altri documenti manoscritti del passato. Le informazioni che si trovano in vecchie lettere, diari e altri documenti può essere estremamente importante per gli storici, ma non vi è alcun modo per eseguire una ricerca per una determinata parola o un concetto senza un programma di riconoscimento della scrittura efficace. Programmi progettati per cercare di riconoscere parole intere piuttosto che singole lettere hanno avuto un certo grado di successo. Tuttavia, i programmi di riconoscimento della scrittura a mano progettato per la lettura della scrittura moderna non si sono dimostrati efficaci nel leggere documenti storici.