Entiendo que cuando el muestreo de una población finita y el tamaño de nuestra muestra es más del 5% de la población, necesitamos hacer un corrección de la media y el error estándar de la muestra mediante esta fórmula:
$ \ hspace {10mm} FPC = \ sqrt {\ frac {Nn} {N- 1}} $
Donde $ N $ es el tamaño de la población y $ n $ es el tamaño de la muestra.
Tengo 3 preguntas sobre esta fórmula:
- ¿Por qué se establece el umbral en 5%?
- ¿Cómo se derivó la fórmula?
- ¿Existen otros recursos en línea que expliquen de manera integral esta fórmula además de este artículo?
Comentarios
- ¡No ' t corrige la media!
- Solo corrige la varianza.
Respuesta
El umbral se elige su ch que asegura la convergencia de la distribución hipergeométrica ($ \ sqrt {\ frac {Nn} {N-1}} $ es su SD), en lugar de una distribución binomial (para muestreo con reemplazo), a una distribución normal (este es el teorema del límite central, ver p. ej., La curva normal, el teorema del límite central y Markov «s y Desigualdades de Chebychev para variables aleatorias ). En otras palabras, cuando $ n / N \ leq 0.05 $ (es decir, $ n $ no es «demasiado grande» en comparación con $ N $), el FPC se puede ignorar con seguridad; es fácil ver cómo evoluciona el factor de corrección al variar $ n $ para un $ N $ fijo: con $ N = 10,000 $, tenemos $ \ text {FPC} =. 9995 $ cuando $ n = 10 $ mientras que $ \ texto {FPC} =. 3162 $ cuando $ n = 9,000 $. Cuando $ N \ to \ infty $, el FPC se acerca a 1 y estamos cerca de la situación de muestreo con reemplazo (es decir, como con una población infinita).
Para comprender estos resultados, un buen punto de partida es leer algunos tutoriales en línea sobre la teoría del muestreo donde el muestreo se realiza sin reemplazo ( muestreo aleatorio simple ). Este tutorial en línea sobre Estadísticas no paramétricas tiene una ilustración sobre cómo calcular la expectativa y la varianza para un total.
Notará que algunos autores usan $ N $ en lugar de $ N-1 $ en el denominador del FPC; de hecho, depende de si trabaja con la estadística de muestra o de población: para la varianza, será $ N $ en lugar de $ N-1 $ si está interesado en $ S ^ 2 $ en lugar de $ \ sigma ^ 2 $.
En cuanto a las referencias en línea, puedo sugerirle
- Estimación e inferencia estadística
- Una nueva mirada a la inferencia para la distribución hipergeométrica
- Finite Muestreo de población con aplicación a la distribución hipergeométrica
- Muestreo aleatorio simple
Comentarios
- Esta fórmula se usa para población finita, pero ¿con reemplazo o sin reemplazo?
- @skan sin reemplazo.