Come avviare un motore di ricerca

August 6

Come avviare un motore di ricerca


Migliaia di programmatori in tutto il mondo sono tranquillamente toccando via sulle loro tastiere cercando di costruire la prossima miglior motore di ricerca. Sergey Brin e Lawrence Page, i famosi creatori di Google, ammettono che "Ingegneria un motore di ricerca è un compito impegnativo." Un motore di ricerca viene utilizzato per trovare informazioni sul Web. Un motore esegue la scansione di Internet e indici milioni di pagine di informazioni, sputando risultati quando qualcuno fa una ricerca.

istruzione

Ottenere un web crawler

1 Acquisire un crawler Web, che è il ragno o bot che striscia attorno alle pagine di raccolta di Internet dal Web. Un ragno visite pagine Web, li legge e segue i collegamenti ad altre pagine. È possibile trovare un crawler open-source o costruire il proprio. Se si vuole costruire il proprio crawler, ottenere un elenco di URL per seminare cingolate con. Un crawler lento è facile da costruire, ma la costruzione di un cingolato ad elevate prestazioni a milioni di indice e milioni di pagine è più impegnativo.

2 Ottenere quante più larghezza di banda, come si può permettere. Avete bisogno di questa larghezza di banda per il vostro crawler mentre viaggia attraverso le pagine Web che ottengono.

3 Costruire un indice. Tutto cingolate trova va in indice di motore di ricerca. L'indice è come un libro gigante o di un catalogo contenente una copia di ogni pagina Web che il crawler trova. Anna Patterson presso la Stanford University raccomanda indicizzazione solo i dati necessari per servire il vostro tipo di risultati di ricerca. Lei consiglia, inoltre, che non si dovrebbe cercare di indicizzare "il lavello della cucina", ma piuttosto "ottenere qualcosa presentabile."

4 Come avviare un motore di ricerca

Il tuo indice contiene tutte le informazioni che si trovano dal web crawler.

Posizione i risultati sull'indice utilizzando un database ad alte prestazioni e tutte le informazioni sui server dal web crawling. È necessario elaborare possibilmente milioni di pagine web per creare l'indice. Le pagine registrate nell'indice devono essere classificati in ordine di ciò che è più rilevante per i vostri ricercatori.

5 Costruire un sito web attraente per restituire i risultati di ricerca.

6 Lanciare e commercializzare il vostro motore di ricerca. Un motore di ricerca gratuito dovrebbe prendere gli utenti dove vogliono andare rapidamente ed elegante, secondo Laszlo Xalieri da motori di ricerca Watch.com. Egli dice che l'esecuzione di un motore di ricerca di successo ", il vostro obiettivo è quello di attrarre i consumatori e vendere l'accesso ad essi a società di marketing."

Consigli e avvertenze

  • Ogni programmatore può avviare un motore di ricerca, ma fornire risultati rilevanti è la vera sfida.