I migliori OCR arabo

March 2

I migliori OCR arabo


Molte sfide affrontano software di riconoscimento ottico dei caratteri lingua araba, non ultimo dei quali è la relativa mancanza di interesse rispetto alle lingue europee. Tuttavia, la scrittura si offre ostacoli significativi, tra cui forme di caratteri variabili e la natura connessa delle lettere. L'importanza dei piccoli punti e altri segni diacritici nel distinguere le lettere altrimenti identici si è anche rivelata problematica, che richiedono scanner di essere estremamente sensibile e il software più discriminante di quanto sia necessario per gli script occidentali. Tuttavia, ci sono alcuni pacchetti professionali disponibili, diversi OCR promettenti in fase di sviluppo e molti piccoli OCR sviluppato da accademici.

Readiris Pro 12 Middle East

Di gran lunga il software di maggior successo araba OCR sul mercato, ha molto migliore funzionalità rispetto ad alcune delle altre opzioni come l'essere in grado di generare una varietà di tipi di documenti, e offre la compressione dei file. E 'anche abbastanza preciso nella lettura scrittura araba, anche se la lingua è l'urdu o Farsi. Tuttavia, questo software particolare è parte di un pacchetto con molte altre lingue incluse, e produce una minore precisione di lettura in quelle lingue di altri OCRs disponibili.

Reader Gold o Platinum automatico

Un po 'meno noto, ma molto più specializzata, è un lettore automatico di AramediA. Ha un minor numero di campane e fischietti, ma non comprende molto meglio elaborazione del linguaggio naturale appositamente per l'arabo. Lo sfondo di sviluppatori coinvolti nel fare questo software include alcuni pesi massimi nelle tecnologie di elaborazione del linguaggio, quindi questo potrebbe venire come piccola sorpresa. Supporta l'arabo per default, e un plug-in è disponibile per supportare Farsi, Jawi, pashto e urdu, dando un più ampio spettro di linguaggi di script arabi supportate di Readiris Pro.

OCR Sviluppato da accademici

Ci sono un certo numero di OCRs lingua e scrittura araba disponibili, spesso poco o nessun costo, che può essere un importante vantaggio rispetto ai pacchetti professionali. Alcuni di questi hanno anche il vantaggio di anni - alcuni più di un decennio - di sviluppo, così come un focus sulla precisione lettore e comprensione del linguaggio. Tuttavia, questi sono generalmente piuttosto lento e privo di altre caratteristiche. quelli più recenti, in particolare, sono stati beneficiari di un ampio database di campioni scritti a mano - noti come ARABASE - e sviluppi nella tecnologia di intelligenza artificiale.

OCR in sviluppo

Una manciata di promettenti OCR arabi sono impostati per essere rilasciato nel 2011 o 2012, che incorpora il meglio del software professionale e recenti sviluppi accademici. Se si contatta direttamente le aziende, si può essere in grado di ottenere una versione beta. Ci sono due OCR particolarmente promettenti in questa categoria - uno basato sul sistema Orano, sviluppato presso l'Università King Fahd in Arabia Saudita, e quella nota come Clever pagina, in uscita a novembre 2011 e supportati da un fondo egiziano collaborazione Information Technology Academia.