Je comprends que lorsque nous échantillonnons à partir dune population finie et que la taille de notre échantillon est supérieure à 5% de la population, nous devons faire un correction sur la moyenne et lerreur standard de léchantillon en utilisant cette formule:

$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $

$ N $ est la taille de la population et $ n $ est la taille de léchantillon.

Jai 3 questions sur cette formule:

  1. Pourquoi le seuil est-il fixé à 5%?
  2. Comment la formule a-t-elle été dérivée?
  3. Existe-t-il dautres ressources en ligne qui expliquent en détail cette formule en plus de cet article?

Commentaires

  • Vous ne ' corriger la moyenne!
  • Vous ne corrigez que la variance.

Réponse

Le seuil est choisi su ch quil assure la convergence de la distribution hypergéométrique ($ \ sqrt {\ frac {Nn} {N-1}} $ est sa SD), au lieu dun distribution binomiale (pour léchantillonnage avec remise), à une distribution normale (il sagit du théorème central limite, voir par exemple La courbe normale, le théorème central limite et Markov « s et Inégalités de Chebychev pour les variables aléatoires ). En dautres termes, lorsque $ n / N \ leq 0.05 $ (cest-à-dire que $ n $ nest pas « trop grand » par rapport à $ N $), le FPC peut être ignoré en toute sécurité; il est facile de voir comment le facteur de correction évolue avec $ n $ variant pour un $ N $ fixe: avec $ N = 10 000 $, on a $ \ text {FPC} =. 9995 $ quand $ n = 10 $ tandis que $ \ text {FPC} =. 3162 $ quand $ n = 9 000 $. Quand $ N \ to \ infty $, le FPC approche 1 et nous sommes proches de la situation de léchantillonnage avec remise (cest-à-dire, comme avec une population infinie).

Pour comprendre ces résultats, un bon point de départ est de lire quelques tutoriels en ligne sur la théorie de léchantillonnage où léchantillonnage se fait sans remplacement ( échantillonnage aléatoire simple ). Ce didacticiel en ligne sur les Statistiques non paramétriques présente une illustration du calcul de lespérance et de la variance pour un total.

Vous remarquerez que certains auteurs utilisent $ N $ au lieu de $ N-1 $ dans le dénominateur du FPC; en fait, cela dépend si vous travaillez avec léchantillon ou la statistique de population: pour la variance, ce sera $ N $ au lieu de $ N-1 $ si vous êtes intéressé par $ S ^ 2 $ plutôt que $ \ sigma ^ 2 $.

En ce qui concerne les références en ligne, je peux vous suggérer

Commentaires

  • Cette formule est utilisée pour une population finie, mais avec remplacement ou sans remplacement?
  • @skan sans remplacement.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *