Come costruire un robot Computer

April 20

Come costruire un robot Computer


robot computer (detti anche bot, crawler o spider) sono programmi software che una ricerca su Internet, raccogliendo informazioni dalle pagine web. Essi non sono virus perché non iniettare il software in altri computer - hanno solo raccogliere informazioni. Il software eseguito sul computer del proprietario robot e non utilizza le risorse di qualsiasi altro sistema. Alcuni robot raccolgono informazioni ai proprietari delle pagine web visitate non sarebbero piuttosto essere liberati, ma i robot di computer hanno diversi usi benigne e ci sono alcuni che si sarebbe probabilmente desidera visitare la pagina web aziendale.

istruzione

1 Creare un algoritmo chiaro prima. Correndo attraverso questa parte è l'errore più comune fatto dai produttori di robot. Si deve sapere che cosa si desidera che il bot per fare in ogni situazione, esattamente quali sono le informazioni che si desidera raccogliere e quando si desidera che il bot di fermare la raccolta di informazioni. La struttura tipica di un bot è un singolo ciclo: Guardate la lista di input di directory, per ogni file in ogni directory di raccogliere le informazioni che state cercando, se trovate collegamenti a nuove directory metterli nella tua lista di directory, controllare sempre per duplicazioni e continuare a fare questo fino a quando la lista di directory è vuota. L'elenco degli elementi trovati deve essere registrata in una forma che è facile da recuperare.

2 Scegliere la lingua e codificare l'algoritmo. È possibile scrivere un robot di computer in qualsiasi lingua, ma alcune lingue sono più facili di altre. Se sei un esperto in una particolare lingua, allora questo è il linguaggio evidente della scelta. Se si sono esperti in una varietà di lingue o sarà l'apprendimento di una lingua solo scrivere il bot, alcune lingue sono migliori di altri. Le lingue di scelta per gli scrittori bot sono Perl e Ruby. Sono entrambi disponibili gratuitamente sul web, relativamente facile da imparare, eseguire rapidamente e hanno caratteristiche che rendono bot scrittura semplice per i non esperti. Ad esempio, entrambe le lingue hanno istruzioni semplici per catturare tutti i file in una directory.

3 Testare il bot. E 'facile creare un bot che funziona senza schiantarsi, ma non raccoglie le informazioni adeguate. Si consiglia di verificare il bot sul proprio sito web in cui si sa quali informazioni debbano essere raccolte. I più siti web si può testare il vostro sito web su una migliore.

Consigli e avvertenze

  • Siti web a volte hanno un file chiamato "robots.txt" al livello superiore di un sito web che contiene il codice di controllo del robot per dirigere il robot in visita. Se si stanno raccogliendo informazioni legittima - come classificare il sito web per un motore di ricerca - il codice di controllo robot può risparmiare un sacco di tempo, limitando la ricerca ai file appropriati.
  • Alcune persone non piace essere visitato da robot e saranno nascondere le informazioni dai robot. Ad esempio, indirizzi e-mail possono essere scritte "abc {at} xyz.net" invece che con il simbolo @ in quanto questo è ciò che distingue un indirizzo email e sarà l'indirizzo email di raccolta bot cercano.