Come convertire HTML in testo Unix

May 2

La conversione di un file HTML in un file di testo Unix non è così difficile come sembra. Un file di testo Unix è solo un file \ "normale \" Windows testo con diversi marcatori di fine linea. (Unix utilizza il carattere di avanzamento riga, o LF, Windows utilizza una combinazione di ritorno a capo e caratteri di avanzamento riga, o CRLF.) Per convertire un file Unix, tutto quello che dovete fare è cambiare le terminazioni di linea per quelle corrette. Una conversione di solito non è necessario in quanto la maggior parte dei programmi in modo trasparente gestire la conversione, ma nel caso in cui è necessario fare questa conversione, i passaggi sono semplici.

istruzione

da Windows

1 Convertire il file HTML in un file di testo. I browser moderni come Internet Explorer e Firefox possono salvare i file HTML come testo normale. Aprire il file nel browser. Premere il \ "Salva con nome \" o \ "Salva pagina come \" dal menu File. Selezionare \ "File di testo \" in \ "Salva come \" la finestra di dialogo per convertire il file.

2 Convertire il file di testo in un file di testo Unix. In Windows, utilizzare un editor di testo avanzato. Aprire il file nell'editor. Cercare \ "Converti in formato Unix \" (o simili) in \ "Tools \" o \ "Opzioni. \"

3 Verificare che il file è stato convertito. Dall'interno l'editor di testo avanzato, scegliere \ "Mostra di fine linea \" in \ "View. \" La fine riga dovrebbero essere \ "LF. \"

Da Unix / Linux

4 Convertire il file HTML in un file di testo. Utilizzare un browser o la riga di comando standard di utilità \ "lince. \" In un terminale, digitare \ "lynx -dump URL> FILENAME \" per convertire una pagina web in un file di testo semplice.

5 Convertire il file di testo in un file di testo Unix utilizzando lo standard di utilità "tr \" \. Se è stato utilizzato un programma Unix / Linux nella Fase 1 per convertire il file HTML, questo passaggio non dovrebbe essere necessario. In un terminale, digitare \ " '\ r' <text_file> CONVERTED_FILE tr -d. \"

6 Verificare che il file è stato convertito. Utilizzare il programma \ "cat \", che è di serie su sistemi Unix / Linux. In un terminale, digitare \ "gatto -e FILENAME \" per visualizzare il file. I fine riga dovrebbero essere il simbolo del dollaro ($). (Se vedi un \ "^ M \" carattere, quindi i fine linea sono in formato Windows).

Consigli e avvertenze

  • Il programma di Lynx è in realtà un browser web di solo testo. Si può usare per navigare sul web in formato testo.