Ik begrijp dat wanneer we een steekproef nemen uit een eindige populatie en onze steekproefomvang meer dan 5% van de populatie is, we een correctie op de gemiddelde en standaardfout van het monster met behulp van deze formule:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Waarbij $ N $ de populatiegrootte is en $ n $ is de steekproefomvang.
Ik heb 3 vragen over deze formule:
- Waarom is de drempel ingesteld op 5%?
- Hoe is de formule afgeleid?
- Zijn er naast dit artikel nog andere online bronnen die deze formule uitvoerig uitleggen?
Reacties
- U corrigeert niet ' het gemiddelde!
- U corrigeert alleen de variantie.
Antwoord
De drempel is zo gekozen ch dat het zorgt voor convergentie van de hypergeometrische distributie ($ \ sqrt {\ frac {Nn} {N-1}} $ is zijn SD), in plaats van een binominale verdeling (voor bemonstering met vervanging), naar een normale verdeling (dit is de centrale limietstelling, zie bijv. de normale curve, de centrale limietstelling en Markovs en Chebychevs ongelijkheden voor willekeurige variabelen ). Met andere woorden, wanneer $ n / N \ leq 0.05 $ (d.w.z. $ n $ is niet “te groot” vergeleken met $ N $), kan de FPC veilig worden genegeerd; het is gemakkelijk te zien hoe de correctiefactor evolueert met variërende $ n $ voor een vaste $ N $: met $ N = 10.000 $ hebben we $ \ text {FPC} =. 9995 $ wanneer $ n = 10 $ terwijl $ \ tekst {FPC} =. 3162 $ wanneer $ n = 9.000 $. Wanneer $ N \ to \ infty $, nadert de FPC 1 en zijn we dicht bij de situatie van bemonstering met vervanging (dat wil zeggen, zoals bij een oneindige populatie).
Om deze resultaten te begrijpen, een goed startpunt is om enkele online tutorials te lezen over de bemonsteringstheorie waarbij bemonstering wordt gedaan zonder vervanging ( eenvoudige willekeurige steekproeven ). Deze online tutorial over Niet-parametrische statistieken bevat een illustratie over het berekenen van de verwachting en variantie voor een totaal.
U zult opmerken dat sommige auteurs $ N $ gebruiken in plaats van $ N-1 $ in de noemer van de FPC; het hangt er in feite van af of u met de steekproef- of populatiestatistiek werkt: voor de variantie is het $ N $ in plaats van $ N-1 $ als u geïnteresseerd bent in $ S ^ 2 $ in plaats van $ \ sigma ^ 2 $.
Wat betreft online referenties, kan ik u voorstellen
- Schatting en statistische gevolgtrekking
- Een nieuwe kijk op inferentie voor de hypergeometrische verdeling
- Eindig Populatiebemonstering met toepassing op de hypergeometrische distributie
- Eenvoudige willekeurige steekproeven
Opmerkingen
- Deze formule wordt gebruikt voor een eindige populatie, maar met vervanging of zonder vervanging?
- @skan zonder vervanging.