Come interrogare un corpo HTML in LINQ

April 3

Il .NET HTML Agility Pack include le librerie LINQ per importare il contenuto del corpo HTML da una pagina Web remoto HTML. LINQ è in genere utilizzato per le connessioni al database, ma gli strumenti .NET esteso il LINQ utilizzare per i dati HTML e XML sul tuo sito web o un sito esterno a distanza. È possibile utilizzare questo metodo per importare il corpo del testo e il codice HTML in una pagina Web.

istruzione

1 Aprire Visual Studio e il progetto che si desidera modificare. Fare doppio clic sul file di codice sorgente per aprire il codice nello spazio di lavoro.

2 Aggiungere le librerie LINQ al file. Copiare e incollare il seguente codice nella parte superiore della pagina Web:

utilizzando HtmlAgilityPack;

3 Link alla pagina Web utilizzando l'URL della pagina. Il seguente codice apre "site.com", ma è possibile utilizzare qualsiasi URL al suo posto:

var = new web HtmlWeb ();
documento var = web.Load ( "site.com");

4 Ottenere le informazioni tag "corpo". Il seguente codice recupera le informazioni contenute nel tag "corpo" della pagina web:

var content = da lnks a document.DocumentNode.Descendants () dove lnks.Name == "corpo"

Text = lnks.innerHTML