Come scrivere booleani espressioni e variabili dummy

January 2

In informatica e la logica, una espressione booleana è una dichiarazione che può essere valutata come vera o falsa.

In statistica, una variabile dummy è un metodo di codifica variabile categorica che ha tre o più livelli in un certo numero di variabili che ciascuno sono vere o false. Per esempio, in un sondaggio di famiglie americane, la variabile "razza / etnia" viene spesso codificata come bianco, nero, Asia / Pacific Islander, Nativi Americani / Alaska Native e ispanica. Dummy codifica questo consiste nello scegliere un livello come livello di riferimento e creare variabili dicotomiche per gli altri livelli.

Il metodo esatto di creare espressioni booleane e codici fittizi varierà a seconda del software che si sta utilizzando, ma la strategia è la stessa.

istruzione

1 Aprire Excel e inserire intestazioni delle colonne. Ad esempio, si potrebbe avere ID nella cella A1, razza / etnia nella cella B1.

2 Inserire i dati. Ad esempio, si potrebbe avere interi 1, 2, 3 ... nella colonna A2, A3, A4 ... e bianco, nero, asiatici, ispanici .... nelle celle B2, B3, B4 e così via.

3 Scegli un livello di riferimento. Un metodo per farlo è quello di scegliere il livello più comune come riferimento. Nell'esempio di razza / etnia nelle famiglie americane, questo sarebbe Bianco. Questo metodo è generalmente applicabile ed è particolarmente utile se la variabile si esegue la codifica è la variabile dipendente in una regressione.

Se la variabile si esegue la codifica è una variabile indipendente, quindi un altro metodo è quello di scegliere il livello che è più alto o più basso su quella variabile dipendente. Ad esempio, se si sta utilizzando razza / etnia come un fattore predittivo di reddito, si potrebbe prima trovare il reddito medio di ogni gruppo e quindi scegliere il più alto come livello di riferimento.

Se si utilizza Excel, inserire intestazioni delle colonne per tutti gli altri livelli. Nell'esempio, questo potrebbe essere nero, asiatici, nativi Etnia nelle celle C1, D1, E1 e F1

4 Fare codici fittizi utilizzando istruzioni IF. In Excel, nell'esempio, digitare = SE (b2 = "nero", 1, 0) nella cella C2 e copiare questo lungo la colonna. Poi entra = IF (b2 = "asiatico", 1, 0) nella cella D2 e ​​copiare che verso il basso colonna D. Nella cella E2 entrare = SE (b2 = "nativo", 1, 0) e nella cella F2 immettere = IF ( b2 = "ispanico", 1, 0). Copiare quelli giù per le colonne.

Poi i dati nelle colonne C a F sono codici fittizi.

Consigli e avvertenze

  • Molti pacchetti software statistici saranno automatizzare la creazione di codici fittizi per voi.