Che cosa è urllib in Python?

May 30

I programmatori si rivolgono al linguaggio di programmazione Python per costruire i loro progetti, in parte a causa della sua vasta libreria di funzioni e moduli built-in. Uno dei questi moduli, urllib, dà ai programmatori un quadro per connettersi e recuperare informazioni da risorse Internet. In questo modo, i programmatori possono fare richieste dai siti web, raccogliere informazioni quali le pagine Web e memorizzare le informazioni sul disco rigido locale.

Recupero Oggetti di rete

Urllib apre oggetti file dal Web da loro accedendo tramite il loro URL. La funzione urlopen otterrà un oggetto di rete da una risorsa di rete, di solito sotto forma di una pagina Web, e conservarla come un oggetto file Python. Questo oggetto può essere manipolato in gran parte allo stesso modo di un oggetto file Python, attraverso funzioni come la lettura o readline.

Oggetti Copia rete

Urllib può anche raccogliere oggetti come le pagine Web da Internet e memorizzarli sul disco rigido locale. In questo modo il programma Python per accedere al file dal disco rigido locale, piuttosto che sempre richiede la pagina ogni volta che è necessario l'oggetto. La funzione urlretrieve ottiene un oggetto di rete e restituisce una tupla, o un insieme di valori, che rappresentano il nome del file salvato ed eventuali intestazioni speciali nel file.

URL di codifica

Urllib può anche prendere una serie di tuple a due di ingresso e di convertirli in URL. La funzione UrlEncode converte una serie di tuple in coppie chiave-valore che diventano parte di un URL in cui la richiesta URL invia informazioni. In questo modo il programma di richiedere informazioni da parte degli utenti, conservarla con un valore chiave che definisce le informazioni richieste del server e costruire un URL per inviare una richiesta di URL.

Gestire codici di risposta HTTP speciale

Quando si effettuano le richieste di oggetti da una rete, in particolare le richieste HTTP (come quando viene effettuata una richiesta per una pagina Web), il server può restituire alcuni codici di risposta. Questi codici significano qualcosa sullo stato della pagina, come esso fosse stato spostato. Altri codici rappresentano il fatto che la pagina non è stato modificato dopo la sua ultima visita e non ha bisogno di essere aggiornata. La funzione FancyURLopener gestisce le richieste in cui tali codici possono essere restituiti e offre di default la gestione per il loro verificarsi.