March 15
Unicode UTF-8 è uno schema di codifica dei caratteri che mappa i codici numerici per caratteri. Ogni personaggio da ogni alfabeto, moderna e antica allo stesso modo, è rappresentato in Unicode. Con la terza edizione di Python venne migliorato il supporto Unicode, che permette di inserire caratteri Unicode in stringhe utilizzando una sequenza di escape. È inoltre possibile modificare la codifica di una stringa in Unicode utilizzando un unico comando. Questo è possibile in Python 3, così come Python 2.
1 Aprire l'editor di testo IDLE che viene fornito con il linguaggio Python.
2 Dichiarare una stringa scrivendo questo nella parte superiore della pagina codice sorgente:
str_0 = "text"
3 Convertire la stringa in Unicode UTF-8 utilizzando la funzione di codificare e assegnarla a un'altra stringa. È possibile eseguire entrambe queste operazioni utilizzando una sola riga di codice, in questo modo:
str_1 = str_0.encode ( 'utf-8')
4 Stampare la stringa codificata utilizzando il comando di stampa, in questo modo:
stampa (str_1)
5 Eseguire il programma premendo il tasto "F5". L'output del programma sarà la versione Unicode della stringa, che assomiglia a questo:
b'text '