Jeg forstår at når prøvetaking fra en endelig populasjon og vår utvalgstørrelse er mer enn 5% av befolkningen, må vi lage en korreksjon på eksemplets gjennomsnitt og standardfeil ved hjelp av denne formelen:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Hvor $ N $ er populasjonsstørrelsen og $ n $ er utvalgsstørrelsen.
Jeg har 3 spørsmål om denne formelen:
- Hvorfor er terskelen satt til 5%?
- Hvordan ble formelen utledet?
- Er det andre ressurser på nettet som forklarer denne formelen grundig i tillegg til dette papiret?
Kommentarer
- Du trenger ikke ' t korrigere gjennomsnittet!
- Du korrigerer bare variansen.
Svar
Terskelen er valgt su ch at det sikrer konvergens av hypergeometrisk distribusjon ($ \ sqrt {\ frac {Nn} {N-1}} $ er dens SD), i stedet for en binomialfordeling (for prøvetaking med erstatning), til en normalfordeling (dette er den sentrale grensesetningen, se f.eks. Normalkurven, den sentrale grensesetningen og Markov «s og Chebychev «Inequalities for Random Variables ). Med andre ord, når $ n / N \ leq 0.05 $ (dvs. $ n $ ikke er «for stor» sammenlignet med $ N $), kan FPC trygt ignoreres; det er lett å se hvordan korreksjonsfaktoren utvikler seg med varierende $ n $ for en fast $ N $: med $ N = 10 000 $ har vi $ \ text {FPC} =. 9995 $ når $ n = 10 $ mens $ \ tekst {FPC} =. 3162 $ når $ n = 9 000 $. Når $ N \ to \ infty $, nærmer FPC seg 1, og vi er nær situasjonen med prøvetaking med erstatning (dvs. som med en uendelig populasjon).
For å forstå disse resultatene, et godt utgangspunkt er å lese noen online veiledninger om prøvetakingsteori der prøvetaking gjøres uten erstatning ( enkel tilfeldig sampling ). Denne elektroniske veiledningen om Ikke-parametrisk statistikk har en illustrasjon på beregning av forventning og varians for en total.
Du vil merke at noen forfattere bruker $ N $ i stedet for $ N-1 $ i nevneren av FPC; faktisk avhenger det av om du jobber med utvalget eller populasjonsstatistikken: for variansen vil det være $ N $ i stedet for $ N-1 $ hvis du er interessert i $ S ^ 2 $ i stedet for $ \ sigma ^ 2 $.
Når det gjelder online referanser, kan jeg foreslå deg
- Estimering og statistisk slutning
- Et nytt blikk på slutning for den hypergeometriske distribusjonen
- Endelig Populasjonsutvalg med anvendelse på den hypergeometriske distribusjonen
- Enkel tilfeldig prøvetaking
Kommentarer
- Denne formelen brukes for endelig befolkning, men med erstatning eller uten erstatning?
- @skan uten erstatning.