Come costringere qualsiasi file in un UTF-8 in Perl

August 13

Come costringere qualsiasi file in un UTF-8 in Perl


Formato Unicode Transformation (UTF-8) è un formato di codifica dei caratteri che utilizza blocchi di otto bit per rappresentare un carattere, ed è ampiamente utilizzato nei sistemi informatici. Esso include lo stesso compatta codifica testo normale come formato ASCII, ma permette anche per la codifica di caratteri speciali. Questo dà funzionalità aggiuntive, ma pone sfide quando viene utilizzato in codice del programma. Le versioni successive di Perl nave con moduli di codifica e una funzione binmode che permettono il linguaggio di programmazione per gestire la codifica e decodifica di file UTF-8. Ingresso e uscita a / da un programma Perl possono essere fatte per gestire i caratteri UTF-8 attraverso l'uso di un interruttore sulla linea di comando.

istruzione

1 Avviare l'editor Perl per avviare la codifica del programma Perl. È possibile utilizzare un semplice editor di testo, come Blocco note su Windows o l'editor vi su UNIX. Si dovrà salvare il file con estensione .pl in modo che il sistema sarà in grado di riconoscere come un programma Perl.

2 Posizionare un imperativo per richiedere il modulo "Encode" nella parte superiore del programma Perl. Sarete in grado di utilizzare le funzioni di codifica e decodifica nel corpo del Programma Perl per codificare i dati / decodifica in / out del formato UTF-8, come richiesto. Digitare il seguente nell'editor Perl per usare questo metodo:

! / Usr / bin / perl

richiedono Encode;
In alternativa, è possibile chiamare il modulo Encode, come segue:
usare Encode;
Per codificare i dati, è necessario digitare il seguente nel corpo del vostro programma:
$ Output = Encode :: encode ( "utf8", $ string);

3 Specificare il formato di codifica UTF-8 quando si apre un file. È possibile farlo digitando uno dei seguenti formati in l'editor:

FILE aperto, "<: encoding (iso-8859-7)", $ inputfile;

aprire il file "<: utf8", $ inputfile;

Questo dirà Perl per codificare il file nel formato UTF-8, o per preparare codifica UTF-8.

4 Specificare i durante la lettura o la scrittura di file "binmode", al fine di garantire che i file sono codificati in formato UTF-8.

Per impostare il binmode in UTF-8 durante la lettura di un file, digitare quanto segue nell'editor:
$ Nomefile = "nomefile.txt";
$ Inputfile = IO :: File-> Nuovo ($ filename, 'r');
binmode ($ inputfile, ': utf8');

Per impostare il binmode in UTF-8 quando si scrive in un file, digitare quanto segue nell'editor:
$ Nomefile = "nomefile.txt";
aperta (OUT, "> $ nomefile");
binmode (OUT, ": utf8");

È inoltre possibile utilizzare binmode per impostare il formato di standard input e output per UTF-8, come segue:
binmode (STDIN, ': utf8');
binmode (STDOUT, ': utf8');