September 13
Il linguaggio di programmazione ASP consente di recuperare web pagina HTML e convertirlo in testo normale. Questo è utile se si desidera estrarre le informazioni da un sito web e striscia fuori i tag HTML prima che l'analisi delle informazioni. È possibile utilizzare la funzione "Sostituisci" mettere a nudo eventuali tag HTML dai dati HTML e tornare solo testo. Si richiede solo poche righe di codice per implementare una conversione HTML-to-text.
1 Creare le variabili ASP. Queste variabili tengono il testo HTML e il contenuto testo normale convertito. Il codice seguente mostra come creare le variabili ASP:
html Dim As String
testo Dim As String
2 Aggiungete un po 'HTML alla variabile "html". Questo può essere il testo immesso da un utente, HTML creato nel modulo o una pagina web. Il codice seguente aggiunge una semplice modifica di titolo alla variabile HTML:
html = "<title> My Web pagina </ title>"
3 Creare la funzione che estrae il codice HTML. La seguente funzione spoglia eventuali tag HTML e gli spazi da codice della pagina web:
HTMLtoText Funzione pubblica (ByVal HTML come stringa) come stringa
Dim strip As _
System.Text.RegularExpressions.Regex
Rientro strip.Replace (HTML, "& lt; [^>] *>", "")
End Function
4 Convertire HTML in testo e assegnare alla variabile "testo". Si chiama la funzione creata nel passaggio 3 per mettere a nudo i tag. Il risultato è il ritorno del testo. Il codice seguente mostra come convertire il codice:
text = HTMLtoText (html)