Rozumiem, że gdy próbkujemy z populacji skończonej, a wielkość naszej próby przekracza 5% populacji, musimy dokonać korekta średniej i standardowego błędu próbki za pomocą następującego wzoru:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Gdzie $ N $ to wielkość populacji, a $ n $ to wielkość próbki.
Mam 3 pytania dotyczące tego wzoru:
- Dlaczego próg jest ustawiony na 5%?
- W jaki sposób uzyskano wzór?
- Czy oprócz tego artykułu, istnieją inne zasoby internetowe, które wyczerpująco wyjaśniają ten wzór?
Komentarze
- Nie ' nie poprawiasz średniej!
- Tylko poprawiasz wariancja.
Odpowiedź
Próg jest wybierany jako ch, że zapewnia zbieżność rozkładu hipergeometrycznego ($ \ sqrt {\ frac {Nn} {N-1}} $ to jego SD), zamiast rozkład dwumianowy (dla próbkowania z zamianą), do rozkładu normalnego (jest to centralne twierdzenie graniczne, patrz np. Krzywa normalna, centralne twierdzenie graniczne i Markov „s i Nierówności Chebycheva dla zmiennych losowych ). Innymi słowy, gdy $ n / N \ leq 0,05 $ (tj. $ N $ nie jest „zbyt duże” w porównaniu z $ N $), FPC można bezpiecznie zignorować; łatwo jest zobaczyć, jak zmienia się współczynnik korygujący przy różnych $ n $ dla stałego $ N $: przy N $ 10 000 mamy $ \ text {FPC} =. 9995 $ gdy $ n = 10 $, podczas gdy $ \ tekst {FPC} =. 3162 $, gdy $ n = 9000 $. Kiedy $ N \ do \ infty $, FPC zbliża się do 1 i jesteśmy blisko sytuacji próbkowania z wymianą (tj. Tak jak w przypadku nieskończonej populacji).
Aby zrozumieć te wyniki, dobry punkt wyjścia polega na przeczytaniu kilku samouczków online na temat teorii próbkowania, w których próbkowanie odbywa się bez zamiany ( proste próbkowanie losowe ). Ten samouczek online na temat statystyk nieparametrycznych zawiera ilustrację obliczania całkowitych oczekiwań i wariancji.
Zauważysz, że niektórzy autorzy używają $ N $ zamiast $ N-1 $ w mianowniku FPC; w rzeczywistości zależy to od tego, czy pracujesz z próbką, czy statystyką populacji: dla wariancji będzie to $ N $ zamiast N-1 $, jeśli interesuje Cię $ S ^ 2 $ zamiast $ \ sigma ^ 2 $.
Jeśli chodzi o referencje online, mogę Ci zaproponować
- Oszacowanie i wnioskowanie statystyczne
- Nowe spojrzenie na wnioskowanie rozkładu hipergeometrycznego
- Skończone Próbkowanie populacji z zastosowaniem do rozkładu hipergeometrycznego
- Proste próbkowanie losowe
Komentarze
- Ta formuła jest używana w przypadku populacji skończonej, ale z wymianą czy bez?
- @skan bez zamiany.