Come costruire un motore di ricerca verticale

August 7

Un motore di ricerca verticale è la più recente tecnologia di ricerca su Internet. Un motore di ricerca verticale, mentre utile in alcune ricerche, deve essere programmato correttamente per fornire i risultati più accurati per l'utente. Ecco come costruire un motore di ricerca verticale in modo che gli utenti possono ottenere i risultati di cui hanno bisogno.

istruzione

1 Scegli quello che ti verrà programmando in. Un crawler basato su Java è uno dei più popolari e può essere più facile da eseguire. Tenere il manuale a portata di mano, quindi se ti trovi in ​​difficoltà che hai un posto dove girare. Si potrebbe anche scegliere qualcosa di simile HttpClient se avete bisogno di più funzionalità, come ad esempio la costruzione di un motore di ricerca verticale a base di lavoro.

2 Decidere l'argomento o gli argomenti il ​​motore di ricerca verticale si concentrerà su. Per esempio, si potrebbe desiderare che gli utenti siano in grado di cercare solo le pagine relative allo sviluppo del bambino, o in vacanza nel sud della Florida.

3 Scrivere una funzione di punteggio che segna ogni sito per le categorie utilizzando un cingolato Java come ad esempio Nutch o Heritrix. Utilizzare una base di parole chiave o di base di rilevamento simile a dare ad ogni sito un punteggio.

4 Impostare una soglia per mostrare siti web pertinenti. Siti web con un certo punteggio per la categoria sono considerati pertinenti e vengono visualizzati i risultati. Ad esempio, se il motore di ricerca verticale trova 50 o più parole chiave su un sito, allora è visualizzata. Siti con un punteggio di sotto di questa soglia non sono.

5 Determinare come avrete a che fare con gli errori, quante discussioni simultanee si vorrà e se si desidera salvare il contenuto della pagina o solo i dati.