Come impostare un parser

March 9

Come impostare un parser


Esistono testo strumenti di analisi per gli amministratori di sistemi e web designer che hanno bisogno di cercare grandi quantità di testo per determinare la struttura e l'organizzazione di computer, script di sistema o documenti di mark-up. script rapido e sporco SED e Perl costruite intorno le espressioni regolari sono spesso sufficienti per lavori semplici, ma il parsing di documenti XML complessi richiede uno strumento più robusto, come la biblioteca ElementTree del linguaggio di programmazione Python.

istruzione

1 Avviare una sessione di terminale o, se preferite, aprire la Python Integrated Development Environment, noto come IDLE, che si trova nella directory Python nell'unità C (Windows) o cartella Applicazioni (Mac). Controlla la tua versione di Python digitando python -v alla riga di comando. ElementTree fa parte della libreria standard di Python come di Python 2.5. Se si dispone di Python 2.4 o precedente, è necessario scaricarlo dalla pagina Python principale.

2 Determinare il tipo di dati codificati in un documento XML leggendo il tag radice. Alla riga di comando, caricare ElementTree e la sua funzione di analisi con il seguente comando:

da elementtree.ElementTree import parse

3 Individuare il file che si desidera analizzare e prendere nota del suo percorso rispetto a quello dell'interprete Python, o semplicemente spostare il file nella cartella Documenti. Impostare una variabile per il file, leggerlo in memoria e scoprire il tipo di dati contenuti nel file con il seguente comando:

albero = ElementTree (file = filename)
elem = tree.getroot ()
elem stampa

Questo rivelerà il tipo di dati codificati nel documento XML.