May 11
I computer non capiscono testo e simboli in modo nativo. Invece, usano un linguaggio di codifica conosciuto come Unicode di tradurre i numeri e le lettere al loro testo e simboli del caso, conosciuto come un set di caratteri. I tipi più comuni di Unicode sono UTF-8, UTF-16, ISO-8859-1 e ASCII. Vi è un identificatore univoco per ogni lettera del testo e il simbolo in Unicode, che rimane costante attraverso diversi sistemi operativi e linguaggi di programmazione. La maggior parte dei linguaggi di programmazione sono dotati di funzioni per tradurre tra diversi standard Unicode.
1 Tradurre il charset in PHP. Tipo "utf8_decode ($ data)," dove "$ dati" punti al codice UTF-8. Il charset ISO-8859-1 risultante viene emesso.
2 Tradurre il charset in Perl. Tipo "QW uso Encode (to_iso88591 from_utf8);
from_to (dati $, "utf8", "iso-8859-1") ;. "Sostituisci" da-utf8 "con il set di caratteri UTF-8 codificato e" to_iso88591 "con l'uscita ISO-8859-1 desiderato.
3 Tradurre il charset in Python. Digitare il seguente codice.
source_encoding = "utf-8"
String = utf8variable
stringa = string.encode (source_encoding)
stringa = unicode (stringa, 'iso-8859-1')
Sostituire "utf8variable" con la variabile che tiene il set di caratteri UTF-8.