Jeg forstår, at når der udtages prøveudtagning fra en endelig population, og vores stikprøvestørrelse er mere end 5% af befolkningen, skal vi lave en korrektion på prøveens gennemsnit og standardfejl ved hjælp af denne formel:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Hvor $ N $ er befolkningsstørrelsen og $ n $ er stikprøvestørrelsen.
Jeg har 3 spørgsmål til denne formel:
- Hvorfor er tærsklen sat til 5%?
- Hvordan blev formlen afledt?
- Er der andre online ressourcer, der grundigt forklarer denne formel udover dette papir?
Kommentarer
- Du behøver ikke ' ikke rette middelværdien!
- Du retter kun variansen.
Svar
Tærsklen vælges su ch at det sikrer konvergens af hypergeometrisk distribution ($ \ sqrt {\ frac {Nn} {N-1}} $ er dens SD) i stedet for en binomialfordeling (til prøveudtagning med erstatning) til en normalfordeling (dette er Central Limit Theorem, se f.eks. Normal Curve, Central Limit Theorem og Markov “s og Chebychevs uligheder for tilfældige variabler ). Med andre ord, når $ n / N \ leq 0,05 $ (dvs. $ n $ ikke er “for stor” sammenlignet med $ N $), kan FPC sikkert ignoreres; det er let at se, hvordan korrektionsfaktoren udvikler sig med varierende $ n $ for en fast $ N $: med $ N = 10.000 $ har vi $ \ text {FPC} =. 9995 $ når $ n = 10 $ mens $ \ sms {FPC} =. 3162 $ når $ n = 9.000 $. Når $ N \ til \ infty $, nærmer FPC sig 1, og vi er tæt på situationen med prøveudtagning med udskiftning (dvs. som med en uendelig population).
For at forstå disse resultater er et godt udgangspunkt er at læse nogle online tutorials om prøvetagningsteori, hvor prøveudtagning sker uden udskiftning ( simpel tilfældig prøveudtagning ). Denne online tutorial på Ikke-parametriske statistikker har en illustration af beregning af forventningen og variansen i alt.
Du vil bemærke, at nogle forfattere bruger $ N $ i stedet for $ N-1 $ i nævneren af FPC; faktisk afhænger det af, om du arbejder med stikprøven eller befolkningsstatistikken: for variansen vil det være $ N $ i stedet for $ N-1 $, hvis du er interesseret i $ S ^ 2 $ snarere end $ \ sigma ^ 2 $.
Hvad angår online referencer, kan jeg foreslå dig
- Estimering og statistisk slutning
- Et nyt kig på slutning for den hypergeometriske distribution
- Endelig Befolkningsudtagning med anvendelse til den hypergeometriske distribution
- Enkel tilfældig stikprøveudtagning
Kommentarer
- Denne formel bruges til endelig befolkning, men med erstatning eller uden erstatning?
- @skan uden erstatning.