Chápu, že když vzorkování z konečné populace a naše velikost vzorku je více než 5% populace, musíme provést oprava střední a standardní chyby vzorku pomocí tohoto vzorce:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Kde $ N $ je velikost populace a $ n $ je velikost vzorku.
Mám 3 otázky týkající se tohoto vzorce:
- Proč je prahová hodnota nastavena na 5%?
- Jak byl vzorec odvozen?
- Existují další online zdroje, které tento vzorec kromě tohoto článku komplexně vysvětlují?
Komentáře
- Nespravujete ' neopravujete průměr!
- Opravujete pouze rozptyl.
Odpověď
Prahová hodnota je zvolena su ch, že zajišťuje konvergenci hypergeometrické distribuce ($ \ sqrt {\ frac {Nn} {N-1}} $ je jeho SD), místo binomická distribuce (pro vzorkování s náhradou), na normální distribuci (jedná se o Centrální limitní větu, viz např. Normální křivka, Centrální limitní věta a Markovovy a Čejčevovy nerovnosti pro náhodné proměnné ). Jinými slovy, když $ n / N \ leq 0,05 $ (tj. $ N $ není „příliš velký“ ve srovnání s $ N $), lze FPC bezpečně ignorovat; je snadné vidět, jak se korekční faktor vyvíjí s proměnlivými $ n $ pro fixní $ N $: s $ N = 10 000 $ máme $ \ text {FPC} =. 9995 $, když $ n = 10 $, zatímco $ \ text {FPC} =. 3162 $, když $ n = 9 000 $. Když $ N \ to \ infty $, FPC se blíží 1 a jsme blízko situaci vzorkování s náhradou (tj. Jako u nekonečné populace).
Abychom těmto výsledkům porozuměli, je dobrým výchozím bodem je přečíst si online výukové programy o teorii vzorkování, kde se vzorkování provádí bez náhrady ( jednoduché náhodné vzorkování ). Tento online tutoriál o Neparametrické statistiky obsahuje příklad výpočtu očekávání a rozptylu pro celkový součet.
Zjistíte, že někteří autoři používají ve jmenovateli FPC místo $ N-1 $; ve skutečnosti to záleží na tom, zda pracujete se statistikou vzorku nebo populace: pro rozptyl to bude $ N $ místo $ N-1 $, pokud vás zajímá spíše $ S ^ 2 $ než $ \ sigma ^ 2 $.
Pokud jde o online reference, mohu vám navrhnout
- Odhad a statistická inference
- Nový pohled na závěr pro hypergeometrickou distribuci
- konečný Vzorkování populace s aplikací na hypergeometrickou distribuci
- Jednoduché náhodné vzorkování
Komentáře
- Tento vzorec se používá pro konečnou populaci, ale s náhradou nebo bez náhrady?
- @skan bez náhrady.