Cómo obtener el valor p de la prueba F

Supongamos que podemos elegir entre dos catalizadores diferentes. Se toman 10 observaciones del primero y 12 del otro. Si $ s_1 = 14 $ y $ s_2 = 28 $, ¿podemos rechazar en $ \ alpha = 5 \% $ la hipótesis de que las varianzas son iguales?

Esto es lo que hizo el maestro:

La relación es: $ s_1 / s_2 = 0.5. $

Entonces

$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0.1538 $$

Luego dice: el valor p es $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ y rechaza $ H_0 $.

¿Cómo obtengo el 0.1538?

Creo que puedo verificar una tabla F para n = 9, m = 11, pero ¿qué hago entonces para obtener la probabilidad de que este valor sea $ \ le 0.5 $?

Comentarios

Arreglé mucho de aparentes errores tipográficos. Por favor, revise la pregunta y corrija cualquier malentendido que pueda haber introducido. Con las estadísticas que proporcione, $ H_0 $ no debe ser rechazado.
Depende de la extensión de sus tablas F y de cómo ' re arreglado. Alternativamente, puede usar un programa que tenga el CDF para la distribución F integrado. Por ejemplo, en R: pf(.5,9,11) da la respuesta [1] 0.1537596
@Glen_b, digamos ' s que tenemos F (.5,9,11). Lo que está diciendo es que en una tabla como esta socr.ucla.edu/applets.dir/f_table.html , se supone que debo encontrar la subtabla adecuada , y luego mire n = 9 y m = 11 y obtenga la probabilidad de allí. ¿Verdad?
Lo que tienes es una tabla de valores críticos. Solo da áreas de cola hasta un 10%; puede usar las propiedades de F para encontrar valores de cola más bajos, pero el valor p de una cola más grande que puede obtener de ese conjunto de tablas será el 10%. Todo lo que ' podría decir es " > 0,1 " en lugar de " = 0.1538 "
De acuerdo. Supongamos ' s que mañana voy a hacer un examen. ¿Cómo voy a obtener mi valor P en una pregunta de la prueba F, sin una computadora?

Respuesta

Lo primero que hay que tener en cuenta es que, dado que se trata de una prueba de varianza, puede que las F que sean grandes o pequeñas sean significativas, mientras que a menudo las tablas F suponen que está haciendo cálculos de tipo ANOVA (donde solo valores grandes de F pueden causar rechazo).

Por lo tanto, debe aprovechar el hecho de que la cola inferior de $ F (\ nu_1, \ nu_2) $ es la misma que la recíproca de la cola superior de $ F (\ nu_2, \ nu_1 ) $.

Hay un poco más de discusión sobre eso aquí

¿Cómo puedo saber en qué cola estoy? – La mediana de una distribución F en los casos de los que tendrá que preocuparse para una prueba de varianza estar cerca de 1. Entonces, si el estadístico F es menor que 1, suponga que necesita la cola inferior. Si es mayor que 1, suponga que necesita la cola superior.

En el ejemplo numérico de su pregunta, F = 0.5 – quiere una cola inferior para F.

Entonces, para encontrar eso, necesita intercambiar los grados de libertad, y los valores F serán todos los inversos de los que necesita. Como necesita el área por debajo de 0.5, es lo mismo que encontrar el área arriba 1 / 0.5 = 2 en un $ F_ {11,9} $.

Por lo tanto, primero debe preocuparse por el $ \ alpha $ más alto que pueda encontrar (0.1 en las tablas indicadas ).

Dado que las tablas que vinculó tienen df1 en las columnas, necesita encontrar la columna 11 y la fila 9 en este caso.

No tienes un 11, así que veamos el 10 y el 12:

 ... 10 12 ⁞ 9 2.41632 2.37888

Entonces, ¿cómo lidias con el hecho de que no hay 11?

Bueno, primero, observe que mientras df2 sea al menos 3 (y será para una prueba de varianza en un examen), la tabla de valores críticos disminuirá a medida que aumenta df

Entonces, si solo obtuviera un límite inferior del valor p, mire el siguiente gl inferior (es decir, compárelo con df1 = 10 en este caso).

[Para obtener más precisión, consulte esta publicación sobre interpolación, que analiza la interpolación en grados de libertad para la F hacia el final. Si su prueba se avecina, dudo que tenga tiempo para aprender algo más que la interpolación lineal. Eso sugiere una interpolación lineal en el recíproco de los grados de libertad.]

El valor en df1 10, df2 = 9 es 2.41632, que es más grande que tu 2. Así que «está más cerca de 1 que el valor de 0,1.

Lo que significa que su valor p de cola inferior es> 0,1

¿Qué pasa si el problema es similar al de la pregunta pero la F dice $ 0.4 $ en lugar de $ 0.5 $?

1 / 0.4 = 2.5 lo que significa que está más adentro de la cola que los dos valores 0.10 anteriores (2.41632, 2.37888). Por tanto, la cola inferior p < 0.10.

Ahora compare con los valores del 5%. Vemos que es menor que los valores 12,9 y 10,9 (que están justo por encima de 3). Por lo tanto, la cola inferior p> 0.05. Entonces $ 0.05 < p < 0.10 $.

¿Qué pasa si el problema es similar al de la pregunta pero la F es entre ¿los valores para 10 y 12?

Ahora digamos que la relación F era 0,323.

Esto está entre el valor de 0.05 para 10,9 y 12,9 df – entonces, ¿p < 0.05 o> 0.05?

Posibilidad 1: digamos que es aproximadamente 0.05.

Posibilidad 2: es decir que debe al menos el siguiente más pequeño (p> 0.025)

Posibilidad 3: usar la interpolación (pero esta vez en el nivel de significancia, no en el gl), como se describe en el enlace de interpolación que di antes. Eso sugiere una interpolación lineal en $ \ log \ alpha $.

Personalmente, si alguna vez tuviera que hacer una prueba F de varianzas en la práctica *, pero de alguna manera no pudiera acceder ni siquiera a una calculadora (con la que hacer una integración numérica rápida), elegiría la opción 3. Si no pudiera hacer eso por alguna razón, elegiría la opción 1. Sin embargo, las expectativas de la persona que la marque bien podrían ser la opción 2.

* si hubiera estado tomando alucinógenos poderosos, o hubiera sufrido un traumatismo craneoencefálico severo, o algún otro incidente que de alguna manera me impidiera apreciar la mala idea que probablemente sería esta.

Valores p de dos colas

Parece que la intención es que se dupliquen los valores p de una cola para obtener valores de dos colas.

Eso está bien en la medida de lo posible, quédese con eso, pero para una discusión de algunos de los problemas con más detalle, consulte la discusión en el ejemplo al final de la respuesta aquí

[Puede agregar más detalles más adelante]

Responder

Primero, la F la estadística no es la proporción de desarrolladores estándar. Es la razón de variaciones. Entonces, F es 196/784 = 0.25. El valor p sería entonces 0.047.

Respuesta

Si necesita un valor p de dos colas, puede usar:

$$ Valor P = 2 min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

donde:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Comentarios

Respuesta

Responder

Respuesta

Deja una respuesta Cancelar la respuesta