Come si consuma un feed Atom in Python

March 17

Atom è uno standard di alimentazione Web che utilizza la tecnologia XML. Un feed Web è un file che contiene le voci che riassumono e si collegano al contenuto di un sito web. I feed Web sono di solito utilizzati per la sottoscrizione di un sito web con l'aiuto di un lettore di feed. Un feed reader è un'applicazione che controlla i feed e visualizza sottoscritto e aggiornamenti sintesi sul contenuto sottoscritto. lettori di feed sono detto di consumare un feed quando si elaborano. È possibile scrivere un semplice script Python che consuma feed Atom in pochi minuti.

istruzione

1 Aprire l'editor di testo IDLE in Programmi (o applicazioni per Macintosh), nella directory Python. Si apre un file di codice sorgente vuoto.

2 Importare il modulo XML Element Tree. Questo modulo permette di attraversare un file XML con facilità. Il feed Atom è un file XML, quindi questo è quello che verrà utilizzato per consumare il mangime dopo che è stato scaricato. Per importare il modulo, scrivere quanto segue nella parte superiore del file di codice sorgente:

importazione xml.etree.ElementTree come e

3 Importare il modulo urllib.request. Questo modulo consente di siti internet aperti (URL) e scaricarli. Per importare questo modulo, scrivere la seguente riga:

importazione urllib.request

4 Dichiarare una stringa e impostare il valore pari a l'URL del feed Atom si desidera consumare. Ad esempio, se si vuole consumare il feed Atom sito abilitato, è possibile scrivere il seguente:

feedString = 'http://www.atomenabled.org/atom.xml'

5 Aprire l'URL al feed Atom utilizzando la funzione urlopen (). Questa funzione crea un oggetto simile a file che è possibile passare sul XML Element Tree. È possibile memorizzare l'oggetto simile a file in una variabile chiamata tmp in questo modo:

tmp = urllib.request.urlopen (feedString)

6 Analizzare l'oggetto simile a file utilizzando l'albero XML Element scrivendo la seguente riga di codice:

albero = etree.parse (tmp)

7 Individuare la radice del file XML utilizzando la funzione GetRoot () del modulo Elemento albero. I file XML sono organizzati come gli alberi, e la radice è la parte superiore del file. Ogni elemento dei rami di file XML fuori dalla radice. Individuando la radice, vi date un buon punto di partenza per muoversi attraverso il file e spigolare le sue informazioni. Per individuare la radice e memorizzarlo in una variabile chiamata 'root', scrivere la seguente riga di codice:

root = tree.getroot ()

8 Loop attraverso il file XML utilizzando un ciclo for, in questo modo:

per il bambino in root:

9 Stampare le informazioni contenute in ogni ramo del file XML, premendo il tasto Tab e scrivere la seguente riga di codice:

print(child.text)

10 Impostare il ramo attuale come nodo principale di una sottostruttura utilizzando la funzione () GetChildren. Lo scopo di questo è di ciclo tra gli elementi XML più profondi del mangime. La sintassi per questa operazione si presenta così:

nipoti = child.getchildren ()

11 Loop attraverso la raccolta dei 'nipoti' utilizzando un ciclo for, in questo modo:

per nipote in nipoti:

12 Rientrare la riga successiva e stampare il testo contenuto nell'elemento XML, in questo modo:

stampa (grandchild.text)

13 Eseguire il programma premendo il tasto "F5". Se il computer è dotato di accesso a Internet, il feed Atom Attivato verrà consumato e il testo che contiene verrà stampato sulla console.