Come limitare Yahoo! Crawler

August 12

Se si dispone di un account di web hosting con larghezza di banda limitata, è possibile che la larghezza di banda consumata dal robot strisciando Yahoo! Web è sproporzionato rispetto alla quantità di traffico che il sito riceve dal motore di ricerca. motore di ricerca Bing di Microsoft fornisce risultati di ricerca di Yahoo! 's negli Stati Uniti, mentre Yahoo! striscia ancora il Web per il suo motore di ricerca in altre parti del mondo. Bloccare entrambi Web crawling robot per limitare l'accesso al tuo sito web di Yahoo! 'S.

istruzione

1 Aprire il Blocco note, e iniziare a lavorare su un file vuoto.

2 Digitare

User-agent: MSNBot

nella prima riga del file. Premere Invio."

3 Digitare

Disallow:

seguito da uno spazio nella seconda riga del file. Quindi digitare nella pagina o una cartella sul sito web che non si desidera che il robot Bing per l'accesso. Non includere il nome di dominio del sito web. Ad esempio, digitare "/ cartella /" per evitare che il robot Bing di accedere a una cartella, o di tipo "/page.htm" per evitare che l'accesso a una pagina. La linea dovrebbe apparire come "Disallow: / cartella /" o "Disallow:. /page.htm" Per evitare che il robot Bing di accedere l'intero sito web, digitare "Disallow:. /"

4 Premere il tasto "Enter" per passare alla riga successiva. Digitare "Disallow:" ancora una volta, e quindi digitare la pagina successiva o directory che non si desidera che il robot Bing per l'accesso. È possibile aggiungere il numero di righe al file che vuoi in questo modo.

5 Premere il tasto "Invio" dopo aver digitato l'ultima riga Disallow.

6 Digitare

User-agent: Slurp

nella successiva riga vuota. Slurp è il nome del robot strisciare Yahoo! Web, che fornisce ancora risultati dei motori di ricerca in alcune parti del mondo.

7 Ripetere ogni riga Disallow digitato in precedenza. Premere il tasto "Enter" per passare alla successiva riga vuota quando si è finito.

8 Digitare

User-agent: *

nella riga successiva.

9 Digitare

Disallow:

nella riga successiva. Questa linea e quello precedente danno accesso senza restrizioni ad altri strisciare web robot, come ad esempio il robot di Google.

10 Aprire il menu "File" e fare clic su "Salva". Salvare il file con il nome "robots.txt".

11 Carica il file robots.txt nella directory principale del server Web. Nella maggior parte dei casi, la directory principale si chiama "public_html".

Consigli e avvertenze

  • Perché Bing offre risultati di ricerca di Yahoo! 'S negli Stati Uniti, bloccando il robot strisciare Bing Web per evitare che il sito web di apparire su Yahoo! impedisce anche di apparire su Bing.