Come usare variabili dummy a Regressione Excel

January 15

il programma Excel popolare di Microsoft ha capacità di analisi dei dati che includono la conduzione di analisi di regressione con variabili dummy. variabili dummy sono variabili categoriali numericamente espressa come 1 o 0 per indicare la presenza o l'assenza di una particolare qualità o caratteristica. Excel non richiede funzioni speciali, quando un modello di regressione include una variabile dummy tra le variabili indipendenti. Tuttavia, i modelli di regressione con variabili dummy dipendenti richiedono ulteriori componenti aggiuntivi, i programmi che si espandono le opzioni e le funzionalità di Excel.

istruzione

Regressione con variabili dummy Utilizzo di Excel

1 Caricare lo strumento di analisi dei dati dai componenti aggiuntivi di Excel, incluso in tutte le versioni di Excel. È necessario farlo per condurre una regressione o di qualsiasi altro tipo di analisi dei dati. Facendo clic su "Strumenti" apre un menu a tendina. Selezionare "Add-ins" e dal menu che si apre, selezionare "Strumenti di analisi" e fare clic su "OK". "Analisi dei dati" dovrebbe comparire nel menu Strumenti.

2 Inserire i dati che si intende utilizzare per la regressione in un foglio di lavoro Excel, codifica eventuali variabili dummy con il valore 1 o 0, a seconda che il soggetto ha la caratteristica in questione. Il genere è un esempio di una variabile dummy, dal momento che i soggetti di uno studio possono essere solo maschio o femmina. Uno studio di punteggi esame di ammissione all'università che comprendeva genere soggetti, per esempio, potrebbe codificare gli studenti di sesso femminile con un 1. Utilizzando variabili dummy tra le variabili indipendenti non richiede particolari funzioni in Excel. Ricordate che se una variabile dummy ha solo due categorie (ad esempio, maschio o femmina), una sola variabile è necessario per rappresentare le due categorie.

3 Codice variabili categoriali con più di due categorie come molteplici variabili dummy, assicurandosi che il numero di variabili è uno in meno del numero di categorie (n-1, in termini statistici). Ad esempio, la categoria etnia espresso come cinque livelli (bianco, nero, ispanici, asiatici, indiani d'America) richiederebbe quattro variabili dummy separati. Ad esempio, se si stesse studiando esame di ammissione all'università punteggi, è possibile creare le seguenti variabili dummy: nero, ispanici, asiatici e americani indiano, codifica ogni 1 se lo studente in questione si inserisce quella categoria etnica.

4 Aumento della capacità del Excel per la regressione con variabili dummy con un componente aggiuntivo che permetterà al programma di condurre regressioni con variabili dipendenti fittizi. Uno di questi programmi è XLSTAT, disponibile per l'acquisto e il download dal produttore, Addinsoft. Programmi come questo permettono di condurre regressioni in cui la variabile dipendente assume i valori o 1 o 0.

Consigli e avvertenze

  • Un errore comune tra i principianti è quello di utilizzare il maggior numero di variabili dummy quante sono le categorie (quali, ad esempio, due variabili dummy per maschi e femmine). Un tale approccio creerebbe multicollinearità, in cui due variabili indipendenti sono altamente correlati, rendendo quasi impossibile determinare i loro effetti separati sulla variabile dipendente. Si ricorda che il numero di variabili dummy dovrebbe sempre uno in meno del numero di categorie.