Tipi di clustering Algoritmi

April 7

Clustering è una tecnica di apprendimento macchina funziona raggruppando i dati simile insieme. Il clustering è un tipo di apprendimento automatico non supervisionato. L'algoritmo non ha bisogno di essere "addestrati" e dati di gruppo può in gruppi coerenti con un concetto "preconcetta" di ciò che appartiene insieme. Questo differisce dai sistemi di apprendimento automatico supervisionato che deve essere "addestrati" per dati di etichetta in modo corretto. Il clustering è utilizzato principalmente come un meccanismo di computer pattern recognition.

Generativa o la probabilità base Algoritmi

algoritmi di clustering basate generativi o di probabilità tentativo di classificare insiemi di dati come una sorta di distribuzione nota, un raggruppamento comune di dati numerici. Questo tipo di algoritmo può essere usato solo dati numerici. algoritmi generativi sono dotati di diversi avvertimenti. Il problema potrebbe essere irrisolvibile se i dati è permesso di variare troppo liberamente. algoritmi generativi anche assumere che i dati incorpora una distribuzione noto, che non è sempre vero. Questi tipi di algoritmi, inoltre, non rappresentano "rumore" nei dati.

K-means Clustering

K-means raggruppamento è stato uno dei primi metodi di clustering da sviluppare. E 'semplice da implementare, tuttavia ha lo svantaggio di essere estremamente sensibili ai suoi ingressi partenza. K-means opere di clustering dividendo i dati in un insieme casuale di cluster e quindi ricalcolare i punti medi di ogni cluster e ripetendo l'operazione fino a quando c'è solo cluster. Questo è noto come convergenza.

clustering Fuzzy

Invece di identificare dati appartenenti a gruppi specifici, fuzzy clustering tenta di identificare il grado in cui un punto dati appartiene a un gruppo. Gli algoritmi che vengono utilizzati per fare fuzzy clustering sono noti come "C-significa algoritmi". Nell'approccio fuzzy clustering, un punto dati può appartenere a più di un gruppo. Questo tipo di raggruppamento è utile quando i punti di dati possono avere bisogno di appartenere a più di un gruppo.

Clustering agglomerante

agglomerative clustering è stato uno dei primi algoritmi di clustering da sviluppare. Esso rimane in uso, come è anche uno degli algoritmi più semplici sviluppati fino ad oggi. agglomerative clustering funziona trattando ciascun punto di dati individuo come un cluster e raggruppamento con il punto dati più simile. Questo processo viene ripetuto fino a quando i dati "converge", o c'è una grande cluster contenente tutti i dati. Il processo può anche essere fatto in senso inverso per lo stesso effetto. Partendo da un cluster, tutti i dati possono essere ripetutamente divisi fino ciascun punto di dati è il proprio cluster.