UTF 7 contro UTF 8

March 2

UTF 7 contro UTF 8


UTF-7 e UTF-8 sono entrambi i tipi di Unicode Transformation Format, lo standard utilizzato per codificare a 16 bit caratteri Unicode, come le lettere internazionali e simboli speciali in un formato che può essere trasmessa attraverso sistemi a 7 bit o 8-bit. UTF-8 è il formato di codifica più comunemente usato, popolare in pagine Web e molti programmi di posta elettronica. UTF-7 offre la codifica di alcuni protocolli di posta elettronica che non funzionano con UTF-8.

Unicode

Unicode è uno standard internazionale per la rappresentazione di caratteri come numeri interi. Esso utilizza 16 bit per carattere contro i sette bit utilizzati dalla ASCII, il codice standard americano per scambio di informazioni. ASCII in grado di riprodurre solo 128 caratteri contro i 65.000 caratteri unici disponibili in Unicode. Questa ampia gamma di caratteri Unicode rende più appropriato per le lingue dell'Asia orientale e altri con grandi set di caratteri, ma i caratteri Unicode deve essere codificato per poter essere trasmessi attraverso canali bit 7 bit o 8-bit.

UTF-8

UTF-8 è il formato universale trasformazione più comune utilizzato per convertire i caratteri Unicode in segmenti a 8-bit per la trasmissione sul Web tramite e-mail o attraverso altri canali a 8 bit. Questo formato di codifica cambia ogni carattere Unicode in una a quattro ottetti, a seconda del valore intero del carattere Unicode, ed è molto efficace per i documenti che utilizzano principalmente le lettere trovate anche nel set di caratteri ASCII. UTF-8 tende a prendere più spazio rispetto alla codifica a byte singolo per alfabeti non occidentali.

UTF-7

UTF-7 è una variante speciale della trasformazione formato universale prima proposto a metà degli anni 1990. E 'stato progettato per rappresentare il testo Unicode con una stringa di caratteri ASCII, producendo un metodo di codifica più efficiente per la posta elettronica da UTF-8, più il stampabile citato codifica necessaria per trasmettere su un percorso di dati a 7 bit. Utilizzando la codifica UTF-7 riduce la dimensione dei caratteri codificati in modo significativo.

considerazioni

Anche se UTF-7 è più efficiente su canali 7-bit da UTF-8 plus, la maggior parte delle autorità quoted-printable compreso Internet Mail Consortium e Microsoft Developer Network raccomandano usando UTF-8 su UTF-7, quando possibile. Questo perché UTF-7 crea problemi di sicurezza e robustezza che non sono presenti in tutti i suoi 8 bit relativo. L'IMC raccomanda inoltre che tutti i programmi di posta elettronica che visualizza create dopo il 1 gennaio 1999 dovrebbe essere in grado di visualizzare la posta in UTF-8.