Come codificare UTF-8 in Python

March 15

Unicode UTF-8 è uno schema di codifica dei caratteri che mappa i codici numerici per caratteri. Ogni personaggio da ogni alfabeto, moderna e antica allo stesso modo, è rappresentato in Unicode. Con la terza edizione di Python venne migliorato il supporto Unicode, che permette di inserire caratteri Unicode in stringhe utilizzando una sequenza di escape. È inoltre possibile modificare la codifica di una stringa in Unicode utilizzando un unico comando. Questo è possibile in Python 3, così come Python 2.

istruzione

1 Aprire l'editor di testo IDLE che viene fornito con il linguaggio Python.

2 Dichiarare una stringa scrivendo questo nella parte superiore della pagina codice sorgente:

str_0 = "text"

3 Convertire la stringa in Unicode UTF-8 utilizzando la funzione di codificare e assegnarla a un'altra stringa. È possibile eseguire entrambe queste operazioni utilizzando una sola riga di codice, in questo modo:

str_1 = str_0.encode ( 'utf-8')

4 Stampare la stringa codificata utilizzando il comando di stampa, in questo modo:

stampa (str_1)

5 Eseguire il programma premendo il tasto "F5". L'output del programma sarà la versione Unicode della stringa, che assomiglia a questo:

b'text '