Come rilevare un carattere CJK in Java

October 15

Come rilevare un carattere CJK in Java


Rilevamento di un carattere cinese, giapponese e coreano, o CJK, in Java è facile con l'uso di alcune classi Java, come InputStreamReader e OutputStreamWriter. Queste due classi si traducono in e fuori di Unicode da codifiche locali, tra cui Big5 e GB2312 codifiche. lingue cinese, giapponese e coreano sono tutti da est asiatico e sono classificati come byte doppio set di caratteri, o DBCS, lingue, il che significa che ciascuna di queste lingue richiederanno una vasta quantità di bit per rappresentare i loro caratteri a doppio byte.

istruzione

1 Aprire la stringa di codice Java che ti verrà convalidando la presenza di caratteri CJK. Assicurarsi che si caricato le classi Java necessarie per l'applicazione Java. Utilizzare l'applicazione Java Swing per assicurarsi di avere queste classi installati.

2 Utilizzare il seguente codice sulla stringa di Java per farlo ritornare vero se la stringa "s" contiene caratteri cinesi:

containsChinese booleani pubblici (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isJapanese(s.charAt(i)) {

return true;

}

}

return false;

}

3 Inserire il seguente codice nella stringa di Java per rendere restituisce true se il carattere "c" è un carattere a doppio byte:

isJapanese booleani pubblici (char c) {

if (c> = '\ u0100' && c <= '\ uffff') return true;

return false;

// Più semplice: il ritorno c> '\ u00ff';

}

4 Utilizzare il codice qui sotto per rendere l'applicazione restituisce true se la stringa "s" contiene caratteri a doppio byte o CJK:

containsDoubleByte public boolean (String s) {

for (int i = 0; i <s.length (); i ++) {

if (isDoubleByte(s.charAt(i)) {

return true;

}

}

return false;

}

Consigli e avvertenze

  • Ci sono molti tutorial per applicazioni Java che si può provare gratuitamente. Partecipa vari forum di discussione per chiedere consiglio e la guida da parte degli utenti di Java con esperienza.
  • Per visualizzare i caratteri della lingua di destinazione correttamente, assicurarsi che il browser ha i font necessari per esso. Il tuo browser deve essere HTML 4.0 compatibile e sostenere Basic Multilingual Plane, che è il set di caratteri a 16 bit standardizzato che riconosce la maggior parte delle lingue utilizzate attivamente nel mondo.