Come rimuovere valori anomali in SPSS

October 26

Come rimuovere valori anomali in SPSS


Valori anomali nelle analisi statistiche sono valori estremi che non sembrano per adattarsi con la maggior parte di un insieme di dati. Se non vengono rimossi, questi valori estremi possono avere un grande effetto su tutte le conclusioni che potrebbero essere tratte dai dati in questione, perché possono inclinare coefficienti di correlazione e le linee di misura migliore nella direzione sbagliata. SPSS è uno di una serie di programmi di analisi statistica che può essere utilizzato per interpretare un insieme di dati e identificare e rimuovere valori anomali.

istruzione

Esplorativa Anaylsis dati

1 Clicca su "Analizza". Seleziona "Statistica descrittiva" seguito da "Esplora".

2 Trascinare e rilasciare le colonne contenenti i dati variabili dipendenti nella casella "Lista dipendente". Fai clic su "OK".

3 Rimuovere eventuali valori anomali individuati da SPSS nelle trame staminali-foglia o box plot eliminando i singoli punti dati. In alternativa, è possibile impostare un filtro per escludere questi punti di dati.

4 Selezionare "Dati" e poi "Seleziona casi" e fare clic su una condizione che ha valori anomali si desidera escludere. Determinare un valore per questa condizione che esclude solo i valori erratici e nessuno dei punti di dati non-periferiche.

5 Scegliere "Se condizione è soddisfatta" nella casella "Select" e quindi fare clic sul pulsante "Se" appena al di sotto di esso. Immettere la regola di escludere valori anomali che si è determinato nel passaggio precedente nella casella in alto a destra. Ad esempio, se si dovesse escludendo misure di cui sopra 74,5 pollici dalla condizione di "altezza", è necessario immettere "altezza <= 74,5." Fai clic su "Continua" e "OK" per attivare il filtro.

Analisi di regressione

6 Nel menu "Analizza", selezionare "regressione" e poi "lineare". Selezionare le variabili dipendenti e indipendenti che si desidera analizzare.

7 Fai clic su "Salva" e quindi selezionare "Distanza di Cook." I valori calcolati per la distanza di Cook verranno salvate nel file di dati come variabili etichetta "COO-1."

8 Eseguire un boxplot selezionando "Grafici" seguito da "Boxplot." Clicca su "semplice" e selezionare "Sintesi della variabili separate." Inserire "COO-1" nella casella "riquadri rappresentano," e quindi immettere un ID o il nome con cui identificare i casi i "casi etichetta" scatola.

9 Ingrandisci il grafico a scatole nel file di output con un doppio clic su di esso. Prendere nota di casi che si trovano al di là delle linee nere --- questi sono i vostri valori anomali. Si può scegliere di rimuovere tutti i valori anomali o solo i valori erratici estreme, che sono contrassegnati da un asterisco (*).

10 Torna nel file di dati e individuare i casi che devono essere cancellati. Lavorando dal basso verso l'alto, evidenziare il numero all'estrema sinistra, nella colonna grigia, quindi si seleziona la l'intera riga. Clicca su "Modifica" e selezionare "Cancella". Ripetere questo passaggio per ogni valore anomalo è stato identificato dal grafico a scatole.

Consigli e avvertenze

  • Quando la cancellazione casi nella sezione 2, punto 5, lavorare sempre dalla parte inferiore del file di dati in movimento a causa dei numeri di identificazione cambiano quando si cancella un caso. Se si lavora dall'alto verso il basso, si finirà per cancellare i casi sbagliate.