Come analizzare parti di HTML che utilizza VB

November 21

Il linguaggio VB.NET include una classe di parsing del codice HTML utilizzato per estrarre i valori HTML dalle pagine Web. Utilizzare i dati analizzati per valutare contenuti di un sito e restituire le informazioni ad un utente o memorizzare le informazioni estratte da un database. La classe parsing del codice HTML consente di leggere il contenuto del testo o qualsiasi valore a elementi del modulo, come caselle di testo o caselle a discesa.

istruzione

1 Aprire il software Visual Studio nel gruppo di programmi "Microsoft .NET Framework". Aprire il progetto VB dopo i carichi di Visual Studio.

2 Fare clic con il nome del progetto nel pannello "Solution Explorer" e selezionare "Proprietà". Fare clic sulla scheda ".NET", quindi fare doppio clic sul file DLL denominato "Microsoft.mshtml." Questa DLL include le classi per analizzare HTML.

3 Aggiungere la libreria di file di codice VB che si desidera utilizzare per analizzare il codice HTML. Copiare e incollare il seguente dichiarazione VB alla parte superiore del vostro file di codice:

Le importazioni MSHTML

4 Un'istanza della classe "HTMLDocument". Questa classe importa il testo HTML è stato importato da una pagina Web o una stringa e imposta le informazioni per l'analisi. Aggiungere il seguente codice alla funzione di analisi:

Dim parseHTML Come IHTMLDocument2 = Nuovo HTMLDocumentClass ()
Dim HTMLData Come IHTMLElementCollection = parseHTML.body.all

5 Recuperare il contenuto della stringa HTML. Per esempio, il codice seguente recupera il valore da una casella di testo HTML in una pagina Web:

Dim tbData Come IHTMLInputElement = allElements.item ( "TextBox1")
Msgbox "Questi sono i dati nella casella di testo:" & tbData.Value