Come convertire HTML in testo ASP

September 13

Il linguaggio di programmazione ASP consente di recuperare web pagina HTML e convertirlo in testo normale. Questo è utile se si desidera estrarre le informazioni da un sito web e striscia fuori i tag HTML prima che l'analisi delle informazioni. È possibile utilizzare la funzione "Sostituisci" mettere a nudo eventuali tag HTML dai dati HTML e tornare solo testo. Si richiede solo poche righe di codice per implementare una conversione HTML-to-text.

istruzione

1 Creare le variabili ASP. Queste variabili tengono il testo HTML e il contenuto testo normale convertito. Il codice seguente mostra come creare le variabili ASP:

html Dim As String

testo Dim As String

2 Aggiungete un po 'HTML alla variabile "html". Questo può essere il testo immesso da un utente, HTML creato nel modulo o una pagina web. Il codice seguente aggiunge una semplice modifica di titolo alla variabile HTML:

html = "<title> My Web pagina </ title>"

3 Creare la funzione che estrae il codice HTML. La seguente funzione spoglia eventuali tag HTML e gli spazi da codice della pagina web:

HTMLtoText Funzione pubblica (ByVal HTML come stringa) come stringa

Dim strip As _

System.Text.RegularExpressions.Regex

Rientro strip.Replace (HTML, "& lt; [^>] *>", "")

End Function

4 Convertire HTML in testo e assegnare alla variabile "testo". Si chiama la funzione creata nel passaggio 3 per mettere a nudo i tag. Il risultato è il ritorno del testo. Il codice seguente mostra come convertire il codice:

text = HTMLtoText (html)