Come esportare HTML in testo

February 25

Esportazione di HTML a testo è un semplice se processo noioso. I file HTML sono file di testo con un .html o .htm estensione. Ci sono diversi modi per rimuovere HTML e mantenere il testo della pagina Web. I tag HTML devono essere rimossi dal file. Il software di terze parti in grado di spogliare il file di tag HTML; un utente può cancellare i tag in un editor di testo o copiare il testo da un browser e incollarlo senza formattazione in un editor di testo.

istruzione

Copiare e incollare il testo

1 Aprire il file HTML nel browser cliccando su "File" e "Apri file".

2 Selezionare il testo facendo clic sulla pagina e trascinando il cursore sul testo per evidenziare il testo. Premere il tasto "Ctrl-C" ( "Cmd-C" su un Mac) per copiare il testo.

3 Aprire l'editor di testo, come Blocco note di Windows o TextEdit in Mac OS X. Fare clic su "Modifica" e scegliere "Incolla". Un semplice editor di testo come Blocco note eliminerà automaticamente i tag HTML dal testo. Tuttavia, se si utilizza un processore più potente Word come editor di testo come Word, allora si avrà bisogno di scegliere "Incolla speciale" e incollare come testo normale o "solo testo" per rimuovere la formattazione.

Utilizzare il software di terze parti

4 Scarica il software di terze parti di vostra scelta che mette a nudo i tag HTML dal testo. Vedere i link di risorse per alcuni suggerimenti.

5 Aprire il file nel software di terze parti. A seconda del software, potrebbe essere necessario aprire il file utilizzando "File" e "Open" per aprire il file. Alcuni software può avere si fa clic su "Sfoglia" per caricare il file per l'esportazione.

6 Fai clic su "OK" o "Salva" o "Convertire", a seconda del software, per avviare il processo di conversione.

Rimuovere i tag in un editor di testo

7 Aprire il file in un editor di testo facendo clic su "File" e "Apri".

8 Individuare il tag <body> nel file. Elimina tutto dal tag <body> up. Questa informazione è per il browser per analizzare il file per la visualizzazione e non fa parte del testo.

9 Individuare il <body /> tag vicino al fondo del documento. Eliminare questo e qualsiasi tag di sotto di essa.

10 Rimuovere tutte le parole e codice tra meno di (<) e maggiore di simboli (>) ed i simboli stessi. Questi sono i tag HTML. Se il vostro editor di testo ha una ricerca e sostituire nel menu "Modifica", cercare "<*>" e sostituire con un campo vuoto. L'asterisco è un carattere jolly che coprirà qualsiasi testo tra i due simboli.