Tengo un generador de números aleatorios de terceros con un período aproximadamente superior a $ 63 * (2 ^ {63} – 1) $ que genera números en el rango $ [0,2 ^ {32} -1] $, es decir, $ 2 ^ {32} $ números diferentes. He hecho algunas modificaciones leves y deseo verificar que su distribución permanezca uniforme. Estoy usando la prueba chi-cuadrado de Pearson para ajustar una distribución, con suerte correctamente, sin saber mucho sobre ella:
-
Divida $ 1000 * 2 ^ {32} $ observaciones en $ 2 ^ {32} $ celdas discretas diferentes (calculo que el número de observaciones $ n $ debería ser $ 5 * 2 ^ {32} \ lt n \ lt 63 * (2 ^ {63} – 1) $, o $ 5 * \ text {rango} \ lt n \ lt \ text {periodicidad} $, usando la regla de cinco o más, para ganar una confianza decente). La frecuencia teórica esperada $ E_i = 1000 * 2 ^ {32} / 2 ^ {32} = 1000 $.
-
la reducción en grados de libertad es 1.
-
$ x ^ 2 = \ sum_ {i = 0} ^ {2 ^ {32} -1} (O_i – E_i) ^ 2 / E_i $.
-
grados de libertad = $ 2 ^ {32} – 1 $.
-
buscar el valor p de un chi -Distribución cuadrada ($ x ^ 2 $) dada $ 2 ^ {32} – 1 $ grados de libertad.
Por lo que puedo decir, no existe una distribución chi-cuadrado para tantos grados de libertad. ¿Qué debo hacer?
-
seleccionar un valor de
confianzasignificativo $ c $ tal que $ p > c $ significa que la distribución es probablemente uniforme. Tengo un tamaño de muestra grande, pero como no estoy seguro de su relación con el valor p (el aumento del muestreo reduce los errores, pero el valor de significancia representa una proporción en los tipos de errores), creo que me quedaré con el valor estándar 0.05.
Editar: preguntas reales en cursiva arriba y enumeradas a continuación:
- Cómo obtener una p -valor?
- ¿Cómo seleccionar un valor de importancia?
Editar:
He hecho una pregunta de seguimiento en bondad de ajuste chi-cuadrado: tamaño y potencia del efecto .
Comentarios
- Existe una distribución chi-cuadrado para cualquier grado de libertad positivo. ¿Quiere decir " No puedo ' t encontrar tablas para df " o " muy grandes función que quiero llamar a won ' t tomar argumentos tan grandes " o algo más? que no rechazar el valor nulo no ' t por sí mismo implica que " la distribución es probablemente uniforme "
- No puedo ' t buscar tablas para df realmente grandes
- Isn ' ¿Hay poca diferencia entre los dos? Un valor p refleja qué tan bien se ajusta el nulo y, aunque no ' no implica otra hipótesis que ' t no se ajusta mejor, su punto es resaltar las observaciones que probablemente no ' t se ajustan al valor nulo (aunque no necesariamente; podría ser un valor atípico). Por lo tanto, por razones prácticas, debo asumir que todas las demás observaciones (si no rechazan el valor nulo) implican " que la distribución es probablemente (aunque no necesariamente; podría ser un valor atípico ) uniforme ".
- Yo ' m solo señalo que no hay un " tal vez " término medio en una prueba de una o la otra, ni tampoco rechazar o no rechazar implica que alguna hipótesis sea cierta. Y cambiar el nivel de confianza solo cambia la proporción de falsos positivos y falsos negativos.
- Si el número de grados de libertad es ' ' muy grande ' ' entonces $ \ chi ^ 2 $ puede ser aproximado por una variable aleatoria normal.
Respuesta
Un chi-cuadrado con grandes grados de libertad $ \ nu $ es aproximadamente normal con una media $ \ nu $ y varianza $ 2 \ nu $.
En este caso, diez mil millones de grados de libertad son suficientes; a menos que esté interesado en una alta precisión en valores p extremos (muy lejos de 0.05), la aproximación normal del chi-cuadrado estará bien.
Aquí hay una comparación a tan solo $ \ nu = 2 ^ {12} $: puede ver que la aproximación normal (curva azul punteada) es casi indistinguible de la chi-cuadrado (curva roja oscura sólida).
La aproximación está lejos mejor en df mucho más grandes.
Comentarios
- Ese ' es un gráfico de $ x ^ 2 $ y no $ x $, ¿verdad? Y con valores p tan pequeños, ¿qué nivel de confianza debería elegir?
- El dibujo es simplemente la densidad de una variable aleatoria de chi-cuadrado ($ X $), cuya densidad es una función de $ x $ .Estás ' realizando una prueba de hipótesis, por lo que ' no tienes un nivel de confianza. Tiene un nivel de significancia pero no ' no elige que después vea un valor p, lo elige antes de comenzar.
- Sí, ese es el gráfico del PDF de la distribución $ x ^ 2_k $. Dado el nombre de la estadística de prueba de ' de Pearson ($ x ^ 2 $), no estaba ' t seguro si $ x $ hace referencia al eje x (en cuyo caso debería tomar primero la raíz cuadrada de la estadística) o el nombre de la distribución (en cuyo caso la estadística se asigna directamente al eje). Las pruebas empíricas de $ \ text {p-value} = 1 – CDF $ en comparación con las tablas confirman lo último.
- El valor p de $ x ^ 2_k $ se calcula mediante el CDF usando: $ 1 – \ frac {1} {\ Gamma (\ frac {k} {2})} * \ gamma (\ frac {k} {2}, \ frac {x} {2}) $, que implica calcular una serie de potencias con números extremadamente grandes.
- En valores k grandes, las distribuciones $ x ^ 2_k $ se aproximan a la distribución normal, por lo que la CDF de la normal se utiliza la distribución: $ 1 – \ frac {1} {2} \ left [1 + \ text {erf $ \ left (\ frac {x – k} {2 * \ sqrt {k}} \ right) $} \ right ] $ como se describe en la respuesta ($ \ sigma $ y $ \ mu $ sustituidos según sea necesario). Esto implica también calcular una serie de potencia , aunque se trata de números más pequeños y erf es un componente estándar de muchas bibliotecas estándar.