A proposito di Web Mining

January 28

Ogni giorno, milioni di utenti una ricerca sul Web, utilizzando i motori di ricerca di fiducia come Google e Yahoo !. Per la maggior parte delle persone, i risultati della ricerca dai motori di ricerca popolari contengono collegamenti a informazioni utili che risponde alle loro domande. L'informazione ha bisogno di grandi aziende, accademici, il governo e ricercatori professionisti va ben oltre la capacità dei motori di ricerca comuni. Essi miniera Internet per i dati invece di link di siti web. Trovare questi dati e il suo funzionamento è essenziale per migliorare i servizi e rimanere competitivi.

Caratteristiche

Il data mining recupera le informazioni desiderate attraverso la ricerca di modelli, il testo e le associazioni di analizzare le informazioni nascoste nel Web invisibile che anche i motori di ricerca non sono indicizzate. Questi dati vengono poi elaborati in banche dati, fogli di calcolo e software speciale per fornire report in base alle esigenze dei minatori.

tipi

attività di data mining rientrano in tre aree distinte: l'estrazione di contenuti, l'utilizzo di data mining e la struttura web mining. identifica minerarie contenuti e categorizza documenti utili che contengono parole o frasi specificate ed elementi multimediali, tra cui immagini e grafica, video e audio, insieme con i database e le tabelle. utilizzo del Web mineraria analizza i log del server, moduli di registrazione del sito e altre informazioni all'utente di raccogliere informazioni sul comportamento dei visitatori una volta giunti a un sito Web specifico. struttura web mining tenta di trovare la relazione tra i siti web. Ricerche recuperare le informazioni dal link in entrata e in uscita ad ogni sito web per rivelare modelli, popolarità, parole chiave simili o dissimili, contenuti o temi.

Caratteristiche

tecniche di web mining in grado di migliorare notevolmente la ricerca dei risultati dei motori di ritorno. Molte applicazioni e programmi Web Mining semplicemente si concentrano solo l'ambito di una normale ricerca per ottenere i dati o modelli desiderati. Altre applicazioni utilizzare le query in linguaggio naturale per la ricerca sul Web, utilizzando strumenti specializzati che restituiscono i risultati della ricerca in una forma specifica, come grafici o statistiche. utilizzo del Web mining si basa sul monitoraggio delle azioni dei visitatori su ogni sito, tra i link scelti e la quantità di tempo trascorso sul sito. struttura di data mining rendimenti sul web i risultati che includono page rank, link popularity, conteggio dei visitatori, e anche il percorso di entrata o di uscita che il sito visitatori prendono.

Benefici

I motori di ricerca non lo fanno indice di oltre il 50 per cento dei contenuti di Internet. Trovare questo contenuto è in termini di tempo per l'utente di Internet media, imprese e professionisti di ricerca. Cerca spider e bot perdere contenuti di valore, perché le loro formule predefinite non cercano specifici tipi di file o all'interno del contenuto dei file. applicazioni minerarie Web possono restituire risultati da documenti Wiki, PDF e HTML che non sono i siti web. Mentre Internet diventa sempre più ricco di contenuti e di come la varietà di aumenti contenuti, data mining offre agli utenti di Internet risultati più pertinenti e porta precedentemente contenuti Web invisibile in superficie.

Potenziale

Congresso e le agenzie governative lottano per identificare l'uso appropriato dei dati derivati ​​dalle attività Web Mining. Una questione chiave per la sicurezza del territorio è le politiche sulla privacy che limitano l'accesso a informazioni di tracciamento degli utenti. Monitoraggio utilizzo di Internet ed e-mail in siti di lavoro devono essere valutati rispetto al potenziale di trovare dati utili che aiuta le aziende e le agenzie governative raggiungere gli obiettivi e gli obiettivi. L'accesso ai cookie dei siti e siti illegali e per adulti presenta potenziali problemi di diritti umani e civili. Competitive business intelligence è recuperabile dai rapporti e intranet annuali delle società minerarie. Questi bisogni devono essere soppesati contro i diritti delle persone di navigare sul web in forma anonima e l'accesso al pubblico le informazioni disponibili.