Capisco che quando si campiona da una popolazione finita e la nostra dimensione del campione è superiore al 5% della popolazione, dobbiamo fare un correzione dellerrore medio e standard del campione utilizzando questa formula:

$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $

Dove $ N $ è la dimensione della popolazione e $ n $ è la dimensione del campione.

Ho 3 domande su questa formula:

  1. Perché la soglia è fissata al 5%?
  2. Come è stata derivata la formula?
  3. Esistono altre risorse online che spiegano in modo esauriente questa formula oltre a questo documento?

Commenti

  • Non ' correggere la media!
  • Correggi solo la varianza.

Risposta

La soglia è scelta su ch che assicura la convergenza della distribuzione ipergeometrica ($ \ sqrt {\ frac {Nn} {N-1}} $ è la sua SD), invece di una distribuzione binomiale (per il campionamento con sostituzione), a una distribuzione normale (questo è il teorema del limite centrale, vedere ad esempio La curva normale, il teorema del limite centrale e Markov “se Disuguaglianze di Chebychev per variabili casuali ). In altre parole, quando $ n / N \ leq 0,05 $ (cioè $ n $ non è “troppo grande” rispetto a $ N $), lFPC può essere tranquillamente ignorato; è facile vedere come evolve il fattore di correzione al variare di $ n $ per un $ N $ fisso: con $ N = 10.000 $, abbiamo $ \ text {FPC} =. 9995 $ quando $ n = 10 $ mentre $ \ testo {FPC} =. 3162 $ quando $ n = 9.000 $. Quando $ N \ to \ infty $, lFPC si avvicina a 1 e siamo vicini alla situazione del campionamento con sostituzione (cioè, come con una popolazione infinita).

Per capire questo risultato, un buon punto di partenza è leggere alcuni tutorial online sulla teoria del campionamento in cui il campionamento viene eseguito senza sostituzione ( campionamento casuale semplice ). Questo tutorial online su Statistiche non parametriche offre unillustrazione sul calcolo delle aspettative e della varianza per un totale.

Noterai che alcuni autori usano $ N $ invece di $ N-1 $ nel denominatore dellFPC; infatti, dipende se si lavora con la statistica campionaria o demografica: per la varianza sarà $ N $ invece di $ N-1 $ se si è interessati a $ S ^ 2 $ invece che a $ \ sigma ^ 2 $.

Per quanto riguarda i riferimenti online, posso suggerirti

Commenti

  • Questa formula viene utilizzata per la popolazione finita, ma con o senza sostituzione?
  • @skan senza sostituzione.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *