Come leggere l'output di SPSS K-Means

October 14

Come leggere l'output di SPSS K-Means


Clustering analisi è una tecnica statistica utilizzata per organizzare casi in categorie in modo che i casi in ciascuna categoria sono simili tra loro e diverso dai casi in altre categorie. Ogni categoria è un cluster. I sociologi usano SPSS (Statistical Package per le Scienze Sociali) per condurre analisi di cluster. In K-Means clustering del ricercatore designa il numero di cluster desiderato. K è il numero di cluster ricercatori indicano che vogliono. K-Means di clustering permette ai ricercatori di raggruppano molto grandi insiemi di dati.

istruzione

analizzare i dati

1 Clicca su "Analizza" nella parte superiore dello schermo esimo SPSS. Selezionare "adesso" dal menu a discesa e "K-Means cluster."

2 Selezionare un campione di casi. Nella finestra di dialogo, cliccare su "Variabili" ed evidenziare le variabili che si desidera utilizzare per l'analisi iniziale K-Means. Fare clic sulla freccia a sinistra per spostare le variabili nella casella. Impostare il numero di cluster, di solito 5 in un set di dati dimensione media, nella casella "numero di cluster." Il numero di cluster deve essere più di due e non più del numero di casi. Clicca su "Itera e classificare" nella finestra di dialogo per ottenere centri di cluster. Clicca su "Write finale".

3 Includere il file di dati tutta per la finale analisi K-Means. Clicca su "Analizza" nella parte superiore dello schermo SPSS. Selezionare "adesso" dal menu a discesa e "K-Means cluster." Nella finestra di dialogo selezionare "Variabili" ed evidenziare le variabili che si desidera utilizzare. Fare clic sulla freccia a sinistra. Impostare il numero di cluster a 5 nella casella "numero di cluster." Clicca su "adesso" nella finestra di dialogo. Scegliere "lettura iniziale" per ottenere i centri dei cluster del campione nel passaggio 2. Fare clic su "Salva". Clicca su "l'appartenenza del cluster." Clicca su "Continua".

Leggere l'output

4 Rivedere la prima tabella in uscita, con l'etichetta "Final Centri cluster." La parte superiore della tabella ha i numeri da 1 a 5 attraverso di esso, indicando ciascuno dei 5 grappoli. La colonna di sinistra elenca i "punteggio fattore REGR" (punteggio fattore di regressione o quanto bene ogni variabile predice il punteggio) per ciascuna delle analisi. Se si segue la linea accanto punteggio 1 per l'analisi 1 verso destra, che vi darà il punteggio fattore per ogni cluster.

5 Leggere il tavolo accanto in uscita intitolato "numero di casi in ogni cluster." La casella a sinistra elenca i grappoli in base al numero, da 1 a 5. Seguire il numero Cluster a destra e troverete il numero di casi in tale cluster.

6 Guardate l'ultima tabella nell'output, "appartenenza Cluster", che mostra quali le cause sono in ogni cluster. I casi sono elencati nella colonna di sinistra e il numero di cluster si trovano nella colonna a destra.

Consigli e avvertenze

  • Rimuovere i valori anomali prima di effettuare le analisi.