Come usare variabili indicatore in regressione multipla Minitab

January 24

Come usare variabili indicatore in regressione multipla Minitab


Una regressione multipla è una procedura statistica che cerca di prevedere i valori di una variabile in base ai valori degli altri. Perché è in grado di analizzare solo i dati numerici, a volte variabili categoriche sono codificati in numeri - ma questo non è corretto perché le variabili categoriche di solito non sono continui. Ad esempio, rosso, blu e verde può essere codificato come uno, due e tre; ma verde non è "superiore" rispetto blu. Invece, dovrebbero essere usati variabili indicatore.

istruzione

1 Caricare Minitab, fai clic su "File", poi "Apri progetto." Individuare la posizione dei dati sul disco rigido del computer, quindi fare doppio clic su di esso per caricare in Minitab.

2 Fai clic su "Calc" dalla barra dei menu, quindi fare clic su "Crea variabili indicatore." Fare doppio clic sulla colonna che contiene la variabile categorica dalla lista a sinistra. Le "variabili indicatore Conservare in colonne" sezione si compila con una nuova colonna per ogni livello di questa categoria. Quindi, se avete rosso, blu e verde, si otterrà tre nuove colonne. Fai clic su "OK" quando fatto.

3 Controllare la finestra del foglio di lavoro per le nuove colonne. Potrai vedere che hanno una serie di zero e uno in loro, che indica quale livello ogni riga dei dati è in. Se una riga è classificato in "rosso", per esempio, avrà "1" nella nuova colonna rosso , e "0" nelle colonne blu e verde. Nota i nomi di queste colonne.

4 . Fai clic su "Stat", "regressione", quindi "regressione" Fare clic all'interno della "scatola di risposta", quindi fare doppio clic sul variabile di risposta - quella si mira a prevedere.

5 Fare clic all'interno della casella "predittori". Per inserire variabili indicatore, fare doppio clic su tutti, ma una delle nuove colonne indicatore variabili. Non importa quale variabile non si inserisce, e si otterrà gli stessi risultati. Questo è perché sono livelli di una variabile, non variabili in sé, in modo Minitab può calcolare il valore del livello finale utilizzando i valori degli altri. Ad esempio, se un punto di dati non è rosso o blu, deve essere verde.

6 Fai clic su "OK" per eseguire la regressione.

Consigli e avvertenze

  • La variabile non si sceglie in fase cinque è chiamato il "gruppo base". Se si desidera conoscere le piste di ogni livello individuale, guardare i risultati della regressione nella finestra di sessione sotto la colonna "Coef". Vedrai i valori di "costante", seguito da valori di tutti i livelli selezionati. "Costante" è il valore del livello non è stata selezionata, e per ottenere il resto è sufficiente sottrarre il loro valore elencato da quello indicato per la costante. Ad esempio, se è costante 40 e rosso è 10, la pendenza per il rosso è 40 - 10 = 30.