Înțeleg că atunci când eșantionarea dintr-o populație finită și dimensiunea eșantionului nostru este mai mare de 5% din populație, trebuie să facem o corecție a eșantionului „medie și eroare standard folosind această formulă:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Unde $ N $ este dimensiunea populației și $ n $ este dimensiunea eșantionului.
Am 3 întrebări despre această formulă:
- De ce pragul este stabilit la 5%?
- Cum a fost derivată formula?
- Există alte resurse online care să explice în mod cuprinzător această formulă în afară de această lucrare?
Comentarii
- Nu ' nu corectați media!
- Corectați doar varianța.
Răspuns
Pragul este ales su că asigură convergența distribuție hipergeometrică ($ \ sqrt {\ frac {Nn} {N-1}} $ este SD-ul său), în loc de distribuție binomială (pentru eșantionare cu înlocuire), la o distribuție normală (aceasta este teorema limitei centrale, vezi, de exemplu, Curba normală, teorema limitei centrale și Markov „s și Inegalitățile lui Chebychev pentru variabilele aleatorii ). Cu alte cuvinte, când $ n / N \ leq 0,05 $ (adică $ n $ nu este „prea mare” în comparație cu $ N $), FPC poate fi ignorat în siguranță; este ușor de văzut cum evoluează factorul de corecție cu diferite $ n $ pentru un $ N $ fix: cu $ N = 10.000 $, avem $ \ text {FPC} =. 9995 $ când $ n = 10 $ în timp ce $ \ text {FPC} =. 3162 $ când $ n = 9.000 $. Când $ N \ to \ infty $, FPC se apropie de 1 și suntem aproape de situația de eșantionare cu înlocuire (adică, cum ar fi cu o populație infinită).
Pentru a înțelege acest lucru rezultă, un bun punct de plecare este să citiți câteva tutoriale online despre teoria eșantionării, unde eșantionarea se face fără înlocuire ( eșantionare simplă ). Acest tutorial online despre Statisticile nonparametrice conține o ilustrare despre calcularea așteptărilor și a varianței pentru un total.
Veți observa că unii autori folosesc $ N $ în loc de $ N-1 $ în numitorul FPC; de fapt, depinde dacă lucrați cu eșantionul sau cu statistica populației: pentru varianță, va fi $ N $ în loc de $ N-1 $ dacă sunteți interesat de $ S ^ 2 $ mai degrabă decât $ \ sigma ^ 2 $.
În ceea ce privește referințele online, vă pot sugera
- Estimare și inferență statistică
- O nouă privire la inferență pentru distribuția hipergeometrică
- Finite Eșantionarea populației cu aplicații la distribuția hipergeometrică
- Eșantionare simplă aleatorie
Comentarii
- Această formulă este utilizată pentru populația finită, dar cu înlocuire sau fără înlocuire?
- @skan fără înlocuire.