SPSS gerarchici metodi di clustering

September 11

I ricercatori usano pacchetto statistico per le scienze sociali per analizzare i loro dati. I sociologi usano cluster di analisi per classificare i casi o partecipanti in categorie o gruppi, così quei casi che sono più simili tra loro sono nello stesso cluster. Cluster analysis comporta una serie di passi che forniscono diversi cluster di casi. I ricercatori esaminano i cluster per determinare la soluzione migliore.

Descrizione di Cluster Analysis

cluster analysis con il pacchetto statistico per le scienze sociali inizia con una serie di casi o partecipanti che si desidera classificare in gruppi di casi simili o cluster. Inizia selezionando quali variabili sono più importanti da utilizzare per identificare i gruppi. Il pacchetto statistico per le scienze sociali fornisce tre metodi distinti per l'analisi dei cluster: k-means, gerarchica, e in due fasi. La procedura si utilizza dipende dalle dimensioni dei dati. Utilizzare la procedura di clustering gerarchico SPSS per piccoli insiemi di dati e di trovare soluzioni con un numero variabile di cluster. Ci sono due tipi principali di procedure di clustering gerarchico: agglomeranti e di divisione.

Agglomerante clustering gerarchico

Agglomerativo clustering gerarchico inizia mettendo ogni singolo caso o un partecipante in un cluster separato. La procedura passa poi attraverso passaggi in cui casi simili sono combinati in cluster sempre più grandi. Una volta che un caso è stato messo in un cluster, non può essere separato dagli altri membri di tale cluster. I cluster sono autorizzati a fondersi con altri cluster, ma non possono essere divisi. Il passo finale mette tutti i casi in un cluster. Né il primo passo - ogni caso è in un cluster separato - né l'ultimo passo - tutti i casi nello stesso cluster - è una soluzione adeguata.

Divisive clustering gerarchico

Divisione procede clustering gerarchico in modo opposto di agglomerativo clustering gerarchico mettendo tutti i casi in un unico grande cluster. Il metodo procede a passi per formare gruppi più piccoli fino a quando ogni caso è in un cluster individuale. La procedura SPSS visualizza i cluster ei casi inclusi in esse ad ogni passo. Né l'uno né grande cluster ogni caso come un cluster separato è una soluzione adeguata.

Soluzioni per le procedure di clustering

Selezionando la soluzione migliore per il clustering procedure è un'arte tanto come una scienza. Non esiste un numero adeguato corretto o non corretto dei cluster. È possibile determinare il numero appropriato di cluster in base a come si intende utilizzare i cluster. Rivedere le soluzioni cluster ad ogni passo successivo e scegliere la soluzione in cui i cluster possono essere interpretati nel modo più logico. A tale scopo, passando in rassegna le soluzioni successive per determinare quale soluzione contiene un numero adeguato di cluster che sembrano contenere casi logicamente simili.