Come leggere una pagina web utilizzando Python

February 22

Questo ti mostrerà come leggere una pagina web da uno script python dato un URL.

istruzione

1 Installare il costruttore pitone da qui. È gratis.

http://www.python.org/download/releases/2.5.2/

2 Dopo aver installato Python è possibile eseguirlo dal menu di avvio

Python 2.5 - IDLE (GUI Python)

3 Una volta aperta l'applicazione, sembra che il blocchetto per appunti. Selezionare file dal menu in alto e una nuova finestra. Si aprirà una nuova finestra di testo che è possibile salvare il codice Python per.

4 Come leggere una pagina web utilizzando Python
Copiare il codice seguito nella nuova finestra che appena aperto.

importazione shutil
os importazione
tempo di importazione
import datetime
importazione matematica
importazione urllib
da array array import

filehandle = urllib.urlopen ( 'http://www.loothog.com')

per le linee in filehandle.readlines ():

print lines

filehandle.close ()

5 Selezionare File - Salva e assegnare un nome al file che si desidera tutto ciò.

6 Premere F5 per eseguire il codice.

Per fermare l'esecuzione del programma, fare clic per la prima finestra che si apriva e selezionare dal menu di Shell - Restart Shell

7 È possibile salvare tutte quelle righe in un file di testo modificando il codice di simile a questa.

myFile = open ( 'test.html', 'w')
per le linee in filehandle.readlines ():

print lines
myFile.write(lines)

myFile.close ()
filehandle.close ()

8 Come leggere una pagina web utilizzando Python


Forse avete alcune quotazioni che assomigliano a questo
AAAC, D, 20071210,8.2,8.2,8.2,9.5,1000

e si desidera ottenere il prezzo di chiusura 9.5, quindi è possibile dividere la linea dal virgole e l'accesso solo il 9.5 come questo

myFile = open ( 'test.html', 'w')
per le linee in filehandle.readlines ():

section = lines.split(',')
print str(sections[6].strip())
myFile.write(str(sections[6].strip()))

myFile.close ()
filehandle.close ()

Nota: La str () converte il numero in una stringa e la .strip () toglierà spazi aggiuntivi alla fine.

Consigli e avvertenze

  • Le righe dopo "per le linee in filehandle.readlines ():" sono rientrate 5 spazi.