Come convertire HTML in testo in Java

August 20

Quando si lavora con Java, può essere particolarmente utile per convertire rapidamente il codice HTML esistente in codice Java utilizzabile. Purtroppo, la conversione manualmente da HTML a Java è un processo che richiede tempo che richiede più busywork di libro-Smarts, che porta molti programmatori di diventare rapidamente frustrati. Per fortuna, c'è un libero, open-source parser HTML per Java che può essere utilizzato per convertire automaticamente HTML per Java senza problemi. Impostare il parser è abbastanza semplice, e dovrebbe solo prendere un po 'di tempo per imparare e padroneggiare.

istruzione

1 Accedere alla pagina di NekoHTML download (vedi link sotto Risorse).

2 Scarica l'ultima versione del parser nekoHTML.

3 Scompattare l'archivio nekoHTML, quindi aggiungere il file "nekohtml.jar" al "percorso di classe" dalla directory nekohtml estratto.

4 Accedere alla pagina di download Xerces Java Parser (vedi link sotto Risorse).

5 Scarica l'ultima versione del parser Xerces sul disco rigido locale.

6 Scompattare l'archivio "Xerces-J-bin.2.9.1". Quindi aggiungere il file "xercesImpl.jar" al "percorso di classe" dalla directory Xerces estratto. Una volta che entrambe .JARs sono state correttamente aggiunti al CLASSPATH, si dovrebbe essere in grado di analizzare tutto il codice HTML quando necessario.

Consigli e avvertenze

  • Se si verificano problemi con il parser, assicurarsi di aver decompresso i file .jar nella posizione corretta, e che il percorso del file in Java sia corretto.