Come estrarre il testo da HTML

November 15

Un file HyperText Markup Language (HTML) contiene una serie di elementi, tra cui tag, sceneggiatura e testi. In alcuni casi, è necessario isolare il testo dal documento HTML in modo che si può utilizzare in altre applicazioni, come ad esempio un articolo o la pubblicazione. L'estrazione di testo da un file HTML è un compito che si può completare in uno dei diversi modi sul computer.

istruzione

Dal browser

1 Caricare il file HTML nel browser Web di scelta. Il testo disponibile appare sullo schermo per impostazione predefinita.

2 Fai clic su "CTRL + A" per selezionare tutto il testo sullo schermo e poi "CTRL + C" per copiare il testo negli appunti del computer.

3 Premere il tasto "CTRL + V" per incollare il testo dal file HTML a un'altra applicazione, ad esempio un documento di Microsoft Word.

Dal vostro editor HTML

4 Caricare il codice HTML in Blocco note o il vostro editor HTML di scelta. Notepad è una scelta comune disponibile sulla maggior parte dei sistemi di computer gratuitamente.

5 Vai alla sezione <body> del file HTML. Fare clic sulla linea direttamente dopo l'apertura tag <body> e selezionare tutto fino alla linea destra prima del </ body> tag di chiusura.

6 Fai clic su "CTRL + C" per copiare il testo e quindi caricare un nuovo documento vuoto del Blocco note. Premere il tasto "CTRL + V" per incollare il testo HTML nel nuovo documento.

7 Passare attraverso il nuovo documento Blocco note ed eliminare qualsiasi tag (come <a href> o <img> tag) in modo che il file contiene solo testo di base.

Uso del software

8 Scaricare un programma estrattore al vostro sistema. HTML Text Extractor, per esempio, è compatibile con i sistemi Windows.

9 Caricare il programma estrattore e digitare l'indirizzo Web della pagina Web contenente il testo è necessario estrarre.

10 Fai clic su "testo estratto" sulla barra degli strumenti per accedere solo il testo. Fai clic su "Copia" per aggiungere il testo negli appunti e poi "CTRL + V" per incollarlo in un'altra applicazione.