Come estrarre il testo tra i tag in pagine html

June 16

Come estrarre il testo tra i tag in pagine html


documenti HTML sono costituiti da tag HTML, che descrivono la struttura di una pagina, e il contenuto effettivo testo tra i tag. Spesso, quando si vuole estrarre il testo da una pagina web, non si desidera che i tag HTML inclusi. Dal momento che i browser web nascondono i tag HTML da vista, è facile copiare il testo da una pagina Web mentre è visualizzato in un browser. Inoltre la copia, è possibile anche modificare la pagina web in un file di testo, togliendo gli elementi HTML.

istruzione

1 Aprire il file HTML in un browser Web che supporta il testo in chiaro; esempi includono Firefox e Internet Explorer. Fai clic su "File" e poi su "Salva con nome". Scegli testo normale come il formato di file dall'elenco a discesa il tipo di file. Fai clic su "Salva". Il browser permette di convertire la pagina web in un documento di testo è possibile aprire in qualsiasi editor di testo.

2 Caricare il documento HTML in un browser Web. Fare clic e trascinare il pulsante sinistro del mouse sul testo che si desidera estrarre. Fai clic sul menu "Modifica" o destro del mouse sulla selezione. Fai clic su "Copia". Aprire un nuovo file in un processore di terze parti editor di testo o una parola. Fai clic su "Modifica" e poi cliccare su "Incolla", oppure premere "Control" e "V." Salvare il testo come un file di testo.

3 Vai online convertitore HTML-to-text, come a WebToolHub. Selezionare e copiare il testo che si desidera estrarre e quindi incollare nella casella di conversione. Fai clic su "Convert". Il sito di conversione rimuoverà tutti i tag HTML, lasciando solo il testo tra i tag. Si noti che questi convertitori offrono poca o nessuna formattazione del testo.