Come codice per estrarre testo da un file DOCX

March 14

Come codice per estrarre testo da un file DOCX


Nel mondo della programmazione, saper leggere il formato di file di Microsoft Word DOCX consente di risparmiare tempo quando si ha bisogno il contenuto in un file DOCX. DOCX è un nuovo formato disponibile in Microsoft Office 2007 e maggiore. Questo formato supporta lo standard XML, che è stato sviluppato per queste versioni di prodotti Microsoft Office. XML è semplicemente un insieme di regole per i documenti di codifica, come un DOCX. È possibile utilizzare Microsoft Visual Basic .NET (VB.NET) per leggere e visualizzare il contenuto di un file DOCX.

istruzione

1 Aprire Microsoft Visual Basic Express e selezionare "Nuovo progetto ..." dal riquadro sinistro dello schermo. Fai clic su "Visual Basic" nella sezione "Modelli installati" e fare doppio clic su "Applicazione console."

2 Fare clic sul riquadro "Strumenti" e fare doppio clic su "Pulsante" per aggiungere un nuovo pulsante al form. Fare doppio clic su "Casella di testo" per aggiungere un nuovo controllo casella di testo al form.

3 Fare clic sul menu "Progetto" e selezionare "<nomeprogetto> Proprietà". Fai clic su "Riferimenti", quindi selezionare "Aggiungi". Selezionare "NET" e fare clic su "DocumentFormat.OpenXml." Fai clic su "OK". Fare doppio clic su "Button1" per aprire la finestra di VB.

4 Copia e incolla il seguente codice nella cima del modulo VB.NET di dichiarare gli spazi dei nomi:

Imports System.IO

Le importazioni DocumentFormat.OpenXml.Packaging

Le importazioni DocumentFormat.OpenXml.Wordprocessing

5 Copiare e incollare il seguente codice sotto "Button1_Click" per definire il percorso e il documento da aprire:

Dim strDoc As String = "C:\docxFile.docx"

Dim txt As String

flusso fioco come flusso = File.Open (strDoc, FileMode.Open)

Modificare la seguente riga di codice e digitare il percorso e il nome al documento:

Dim strDoc As String = "C:\docxFile.docx"

6 Copiare e incollare il seguente per chiamare la procedura per leggere in realtà il documento:

OpenAndAddToWordprocessingStream(stream, txt)

stream.Close ()

7 Copiare e incollare il seguente per visualizzare il testo letto nel controllo casella di testo:

Me.TextBox1.Text = txt

8 Copiare e incollare la seguente procedura per aprire il file DOCX e restituire il contenuto letto:

Public Sub OpenAndAddToWordprocessingStream(ByVal stream As Stream, ByRef txt As String)

Dim wordprocessingDocument Come WordprocessingDocument = wordprocessingDocument.Open (torrente, True)

corpo fioco come Corpo = wordprocessingDocument.MainDocumentPart.Document.Body

txt = body.InnerText.ToString

wordprocessingDocument.Close ()

End Sub

9 Premere il tasto "F5" per eseguire il programma, quindi fare clic su "Button1" per eseguire il codice.