November 21
Il linguaggio VB.NET include una classe di parsing del codice HTML utilizzato per estrarre i valori HTML dalle pagine Web. Utilizzare i dati analizzati per valutare contenuti di un sito e restituire le informazioni ad un utente o memorizzare le informazioni estratte da un database. La classe parsing del codice HTML consente di leggere il contenuto del testo o qualsiasi valore a elementi del modulo, come caselle di testo o caselle a discesa.
1 Aprire il software Visual Studio nel gruppo di programmi "Microsoft .NET Framework". Aprire il progetto VB dopo i carichi di Visual Studio.
2 Fare clic con il nome del progetto nel pannello "Solution Explorer" e selezionare "Proprietà". Fare clic sulla scheda ".NET", quindi fare doppio clic sul file DLL denominato "Microsoft.mshtml." Questa DLL include le classi per analizzare HTML.
3 Aggiungere la libreria di file di codice VB che si desidera utilizzare per analizzare il codice HTML. Copiare e incollare il seguente dichiarazione VB alla parte superiore del vostro file di codice:
Le importazioni MSHTML
4 Un'istanza della classe "HTMLDocument". Questa classe importa il testo HTML è stato importato da una pagina Web o una stringa e imposta le informazioni per l'analisi. Aggiungere il seguente codice alla funzione di analisi:
Dim parseHTML Come IHTMLDocument2 = Nuovo HTMLDocumentClass ()
Dim HTMLData Come IHTMLElementCollection = parseHTML.body.all
5 Recuperare il contenuto della stringa HTML. Per esempio, il codice seguente recupera il valore da una casella di testo HTML in una pagina Web:
Dim tbData Come IHTMLInputElement = allElements.item ( "TextBox1")
Msgbox "Questi sono i dati nella casella di testo:" & tbData.Value