Guida di caratteri ANSI estesa

April 17

Guida di caratteri ANSI estesa


L'American National Standards Institute, o ANSI, Character Set comprende 256 caratteri, dell'alfabeto maiuscole e minuscole a numeri, punteggiatura e caratteri accentati. E 'standardizzato il set di caratteri di base utilizzato dai dispositivi di calcolo, definire quali caratteri da includere e la sequenza in cui sono loro. I primi 128 caratteri nel set ANSI completo, da zero a 127, costituiscono i caratteri ASCII, che comprendono 32 sequenze di controllo. Da 128 a 255, i caratteri ANSI estesi includono lettere accentate, i simboli matematici e caratteri line-drawing.

prima Standards

Il mondo dell'informatica è iniziato con una babele di set di caratteri, ogni produttore del dispositivo definisce una propria serie di sequenze di input e di controllo. Questi sistema presto utilizzato schede perforate carta come mezzo di memorizzazione dei dati. Le posizioni su una scheda che contenevano o mancava pugni determinate le informazioni memorizzate. IBM, UNIVAC, FORTRAN, STRETCH: ognuno di questi sistemi utilizzati accordi caratteri diversi e il numero di caratteri. Senza uno standard complessivo, questi dispositivi mancava la capacità di comunicare tra loro.

ASCII

L'originale Codice American Standard for Information Interchange, o ASCII, set di caratteri è iniziata nel 1960 con il computer pioniere Bob Bemer, un dipendente di IBM che ha capito che il caos punch-carta di competere sistemi operativi primi frenato l'adozione del computer. A quel tempo, IBM si utilizza differenti codifiche di nove caratteri tra i suoi prodotti. Bemer ha presentato una proposta di codice-sequenza ANSI, che alla fine ha approvato un piano molto simile a quello originale di Bemer. Diciotto anni dopo, il PC IBM è stato il primo computer che utilizza ASCII.

caratteri ASCII

Posizionato all'interno di una griglia numerica che si estende da zero a 128, il set di caratteri ASCII inizia con un set di 32 sequenze di controllo, alcune delle quali non vedono più diffuso utilizzo e altri, come "ESC", che rimangono parte di computazione di oggi. Lo "spazio" serve come carattere 32, il 33 ° nel set, dai simboli non alfabetici come il carattere cancelletto, simbolo del dollaro, e commerciale e la punteggiatura. I numeri da zero a nove costituiscono caratteri 48 attraverso 57, seguiti da più segni di punteggiatura e simboli matematici. L'alfabeto maiuscolo appare da 65 a 90, seguito da caratteri non alfabetici più. A completare il set ASCII, 97 a 122 tenere l'alfabeto minuscolo, seguito da parentesi graffe, il simbolo pipe, la tilde e il "DEL", o eliminare, carattere.

caratteri estesi

Il vero set di caratteri ANSI dedica posizioni da 128 a 255 per i caratteri accentati utilizzati dalla maggior parte delle lingue europee, tra cui le combinazioni di due caratteri chiamati digrammi, vocali e maiuscole e minuscole e consonanti. Insieme con le frazioni pre-fatti, la punteggiatura non in lingua inglese, il simbolo dei gradi e alcuni apici alfanumerici, include anche i caratteri greci e simboli di equazione comuni in matematica, e una serie di caratteri utilizzati per disegnare scatole singole e doppie-governato simili a le cornici intorno tabelle HTML.

Al di là e accanto ANSI

Insieme con il vero set di caratteri ANSI, il set di Microsoft Windows ANSI definisce una variante con un nome confondibile e personaggi sostanzialmente simili. Manca caratteri di line-disegno di ANSI e comprende altri segni di punteggiatura, invece, tra i quali due simboli di marchio, il simbolo di copyright, un punto di puntini di sospensione pre-fatto, il proiettile, em-dash e en-dash. Al di là delle tradizionali limitazioni di 256 caratteri di ANSI, Unicode rende possibile set di caratteri con migliaia di glifi, che possono ospitare quasi tutte le lingue del mondo, comprese quelle che non utilizzano l'alfabeto latino, come le lingue asiatiche e del Medio Oriente.