Come si ottiene il cluster di dati di una distribuzione campionaria Più vicino alla media?

May 30

Come si ottiene il cluster di dati di una distribuzione campionaria Più vicino alla media?


Statistica inferenziale è il processo di stima di una variabile in una popolazione sulla base di dati noto da un campione più piccola di quella popolazione. Affinché stime accurate da effettuare, la media e la distribuzione del campione devono essere il più vicino possibile alla popolazione da cui è presa. Ci sono diversi passaggi che si possono prendere a tal fine.

istruzione

1 Utilizzare una dimensione di grande campione come tempo e fondi consentono. Se si utilizza un campione più piccolo, è più probabile che il campione raggrupparsi intorno a una media che non rappresenta la vostra popolazione. Al contrario, maggiore il campione è, maggiore è la probabilità che statisticamente corrispondere popolazione.

2 Utilizzare il campionamento casuale. Idealmente, ogni punto di dati della popolazione dovrebbe avere la stessa probabilità di finire nel campione. Se questo non è il caso, le stime saranno distorte. Ad esempio, se si vuole stimare il valore medio netto di persone nel vostro paese, e si raccolgono solo i dati di esempio dalla città più ricca, il campione sarà molto probabilmente un eccesso di stima media della popolazione.

3 Rimuovere valori anomali. Un valore anomalo è un punto di dati che si trova lontano dal cluster principale. Anche se essi rappresentano punti di dati legittime dal campione, si consiglia di rimuoverli, in alcuni casi, ad esempio quando la dimensione del campione è abbastanza piccolo, o se per qualche motivo è necessario utilizzare la media invece di un'altra misura di tendenza centrale, come la mediana . Ad esempio, se il sondaggio patrimonio netto incluso 10 persone - 9 classe media, e Bill Gates - la vostra stima del salario medio può essere gonfiato, per cui si potrebbe contrastare questo rimuovendo il valore anomalo.