Supongamos que podemos elegir entre dos catalizadores diferentes. Se toman 10 observaciones del primero y 12 del otro. Si $ s_1 = 14 $ y $ s_2 = 28 $, ¿podemos rechazar en $ \ alpha = 5 \% $ la hipótesis de que las varianzas son iguales?
Esto es lo que hizo el maestro:
La relación es: $ s_1 / s_2 = 0.5. $
Entonces
$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0.1538 $$
Luego dice: el valor p es $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ y rechaza $ H_0 $.
¿Cómo obtengo el 0.1538?
Creo que puedo verificar una tabla F para n = 9, m = 11, pero ¿qué hago entonces para obtener la probabilidad de que este valor sea $ \ le 0.5 $?
Comentarios
Respuesta
Lo primero que hay que tener en cuenta es que, dado que se trata de una prueba de varianza, puede que las F que sean grandes o pequeñas sean significativas, mientras que a menudo las tablas F suponen que está haciendo cálculos de tipo ANOVA (donde solo valores grandes de F pueden causar rechazo).
Por lo tanto, debe aprovechar el hecho de que la cola inferior de $ F (\ nu_1, \ nu_2) $ es la misma que la recíproca de la cola superior de $ F (\ nu_2, \ nu_1 ) $.
Hay un poco más de discusión sobre eso aquí
¿Cómo puedo saber en qué cola estoy? – La mediana de una distribución F en los casos de los que tendrá que preocuparse para una prueba de varianza estar cerca de 1. Entonces, si el estadístico F es menor que 1, suponga que necesita la cola inferior. Si es mayor que 1, suponga que necesita la cola superior.
En el ejemplo numérico de su pregunta, F = 0.5 – quiere una cola inferior para F.
Entonces, para encontrar eso, necesita intercambiar los grados de libertad, y los valores F serán todos los inversos de los que necesita. Como necesita el área por debajo de 0.5, es lo mismo que encontrar el área arriba 1 / 0.5 = 2 en un $ F_ {11,9} $.
Por lo tanto, primero debe preocuparse por el $ \ alpha $ más alto que pueda encontrar (0.1 en las tablas indicadas ).
Dado que las tablas que vinculó tienen df1 en las columnas, necesita encontrar la columna 11 y la fila 9 en este caso.
No tienes un 11, así que veamos el 10 y el 12:
... 10 12 ⁞ 9 2.41632 2.37888
Entonces, ¿cómo lidias con el hecho de que no hay 11?
Bueno, primero, observe que mientras df2 sea al menos 3 (y será para una prueba de varianza en un examen), la tabla de valores críticos disminuirá a medida que aumenta df
Entonces, si solo obtuviera un límite inferior del valor p, mire el siguiente gl inferior (es decir, compárelo con df1 = 10 en este caso).
[Para obtener más precisión, consulte esta publicación sobre interpolación, que analiza la interpolación en grados de libertad para la F hacia el final. Si su prueba se avecina, dudo que tenga tiempo para aprender algo más que la interpolación lineal. Eso sugiere una interpolación lineal en el recíproco de los grados de libertad.]
El valor en df1 10, df2 = 9 es 2.41632, que es más grande que tu 2. Así que «está más cerca de 1 que el valor de 0,1.
Lo que significa que su valor p de cola inferior es> 0,1
¿Qué pasa si el problema es similar al de la pregunta pero la F dice $ 0.4 $ en lugar de $ 0.5 $?
1 / 0.4 = 2.5 lo que significa que está más adentro de la cola que los dos valores 0.10 anteriores (2.41632, 2.37888). Por tanto, la cola inferior p < 0.10.
Ahora compare con los valores del 5%. Vemos que es menor que los valores 12,9 y 10,9 (que están justo por encima de 3). Por lo tanto, la cola inferior p> 0.05. Entonces $ 0.05 < p < 0.10 $.
¿Qué pasa si el problema es similar al de la pregunta pero la F es entre ¿los valores para 10 y 12?
Ahora digamos que la relación F era 0,323.
Esto está entre el valor de 0.05 para 10,9 y 12,9 df – entonces, ¿p < 0.05 o> 0.05?
Posibilidad 1: digamos que es aproximadamente 0.05.
Posibilidad 2: es decir que debe al menos el siguiente más pequeño (p> 0.025)
Posibilidad 3: usar la interpolación (pero esta vez en el nivel de significancia, no en el gl), como se describe en el enlace de interpolación que di antes. Eso sugiere una interpolación lineal en $ \ log \ alpha $.
Personalmente, si alguna vez tuviera que hacer una prueba F de varianzas en la práctica *, pero de alguna manera no pudiera acceder ni siquiera a una calculadora (con la que hacer una integración numérica rápida), elegiría la opción 3. Si no pudiera hacer eso por alguna razón, elegiría la opción 1. Sin embargo, las expectativas de la persona que la marque bien podrían ser la opción 2.
* si hubiera estado tomando alucinógenos poderosos, o hubiera sufrido un traumatismo craneoencefálico severo, o algún otro incidente que de alguna manera me impidiera apreciar la mala idea que probablemente sería esta.
Valores p de dos colas
Parece que la intención es que se dupliquen los valores p de una cola para obtener valores de dos colas.
Eso está bien en la medida de lo posible, quédese con eso, pero para una discusión de algunos de los problemas con más detalle, consulte la discusión en el ejemplo al final de la respuesta aquí
[Puede agregar más detalles más adelante]
Responder
Primero, la F la estadística no es la proporción de desarrolladores estándar. Es la razón de variaciones. Entonces, F es 196/784 = 0.25. El valor p sería entonces 0.047.
Respuesta
Si necesita un valor p de dos colas, puede usar:
$$ Valor P = 2 min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$
donde:
$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $
pf(.5,9,11)
da la respuesta[1] 0.1537596