Capisco che quando si campiona da una popolazione finita e la nostra dimensione del campione è superiore al 5% della popolazione, dobbiamo fare un correzione dellerrore medio e standard del campione utilizzando questa formula:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Dove $ N $ è la dimensione della popolazione e $ n $ è la dimensione del campione.
Ho 3 domande su questa formula:
- Perché la soglia è fissata al 5%?
- Come è stata derivata la formula?
- Esistono altre risorse online che spiegano in modo esauriente questa formula oltre a questo documento?
Commenti
- Non ' correggere la media!
- Correggi solo la varianza.
Risposta
La soglia è scelta su ch che assicura la convergenza della distribuzione ipergeometrica ($ \ sqrt {\ frac {Nn} {N-1}} $ è la sua SD), invece di una distribuzione binomiale (per il campionamento con sostituzione), a una distribuzione normale (questo è il teorema del limite centrale, vedere ad esempio La curva normale, il teorema del limite centrale e Markov “se Disuguaglianze di Chebychev per variabili casuali ). In altre parole, quando $ n / N \ leq 0,05 $ (cioè $ n $ non è “troppo grande” rispetto a $ N $), lFPC può essere tranquillamente ignorato; è facile vedere come evolve il fattore di correzione al variare di $ n $ per un $ N $ fisso: con $ N = 10.000 $, abbiamo $ \ text {FPC} =. 9995 $ quando $ n = 10 $ mentre $ \ testo {FPC} =. 3162 $ quando $ n = 9.000 $. Quando $ N \ to \ infty $, lFPC si avvicina a 1 e siamo vicini alla situazione del campionamento con sostituzione (cioè, come con una popolazione infinita).
Per capire questo risultato, un buon punto di partenza è leggere alcuni tutorial online sulla teoria del campionamento in cui il campionamento viene eseguito senza sostituzione ( campionamento casuale semplice ). Questo tutorial online su Statistiche non parametriche offre unillustrazione sul calcolo delle aspettative e della varianza per un totale.
Noterai che alcuni autori usano $ N $ invece di $ N-1 $ nel denominatore dellFPC; infatti, dipende se si lavora con la statistica campionaria o demografica: per la varianza sarà $ N $ invece di $ N-1 $ se si è interessati a $ S ^ 2 $ invece che a $ \ sigma ^ 2 $.
Per quanto riguarda i riferimenti online, posso suggerirti
- Stima e inferenza statistica
- Un nuovo sguardo allinferenza per la distribuzione ipergeometrica
- Finita Campionamento della popolazione con applicazione alla distribuzione ipergeometrica
- Campionamento casuale semplice
Commenti
- Questa formula viene utilizzata per la popolazione finita, ma con o senza sostituzione?
- @skan senza sostituzione.