Tengo una pregunta bastante simple sobre la interpretación de la prueba F en Microsoft Excel.

Digamos que estos son los resultados de mi prueba F:

ingrese la descripción de la imagen aquí

Ahora me pregunto cómo interpretarlo para elegir la prueba t correcta (asumiendo varianzas iguales o desiguales) para mi conjunto de datos.

He encontrado guías que me dicen si F crítico> F, entonces use varianzas desiguales. Sin embargo, algunas de las guías le dicen que use solo el valor p, por lo que no estoy seguro de qué parámetros considerar al interpretar los resultados.

Respuesta

Varias cosas:

1) Al hacer pruebas de hipótesis, la decisión es la misma ya sea que use valores p o valores críticos (si no lo es, hiciste algo mal, o al menos inconsistente).

2) Cuando los tamaños de muestra son iguales, la prueba t (o ANOVA) es menos sensible a las diferencias rencias en varianza.

3) No debe hacer una prueba formal de igualdad de varianza para determinar si debe asumir o no varianzas iguales; el procedimiento resultante para probar la igualdad de medias no tiene las propiedades que probablemente desearía tener. Si no se siente razonablemente cómodo con el supuesto de igual varianza, no lo haga (si lo desea, asuma que las varianzas siempre son diferentes a menos que tenga alguna razón para pensar que van a ser bastante cercanas). La prueba t (y ANOVA) no son muy sensibles a las diferencias pequeñas a moderadas en la varianza de la población, por lo que con tamaños de muestra iguales (o casi iguales), debe estar seguro siempre que esté seguro de que no son muy diferente.

4) La prueba F «habitual» para la igualdad de varianza es extremadamente sensible a la no normalidad . Si debe probar la igualdad de varianza, usar esa prueba no sería mi consejo.

Es decir, si puede hacer una prueba de tipo Welch o similar, es posible que esté mejor solo para hacerlo. Nunca le costará mucho, puede ahorrar mucho. (En su situación particular en este caso, probablemente esté lo suficientemente seguro sin él, pero no hay ninguna razón en particular para no hacerlo).

Notaré que R por defecto usa la prueba de Welch cuando intenta hacer una prueba t de dos muestras; solo hace la versión de igual varianza cuando se lo indica. Creo que esta es la forma correcta de hacerlo (hacer lo más seguro por defecto), aunque solo sea para salvarnos de nosotros mismos.

Comentarios

  • Gracias por tu respuesta, Glen_b. Sin embargo, en i.imgur.com/evP3NPh.jpg , el valor crítico de F es mayor que el valor de F, lo que me induciría a utilizar la prueba t suponiendo que no es igual varianzas, pero el valor p es mayor que 0,05, lo que me impulsaría a usar la prueba t asumiendo varianzas iguales. Es por eso que tengo curiosidad sobre cómo interpretar los resultados.
  • Usted ' está equivocado. Tener la F menor que el valor crítico no es ' t sugiriendo que las variaciones son más diferentes de lo que podría haber ocurrido por casualidad. Tienes eso exactamente al revés (¿puedes señalar las guías que lo dicen?). De ahí mi comentario anterior: " la decisión es la misma si usa valores p o valores críticos (si no es ' t, hiciste algo mal …) ". La implicación directa es que hiciste algo mal. Pero dados mis otros comentarios, ' es completamente discutible. El ejercicio es una mala idea en cualquier caso.
  • No hay problema, aquí está una de las fuentes: chemistry.depaul.edu/wwolbach/390_490/Excel / …
  • Ok, creo que lo entiendo ahora. Este elemento F crítico > F funciona solo cuando p < 0.05, de lo contrario, ¿podemos decir que las muestras tienen variaciones iguales?
  • Creo que ' no lo entiende. Si $ F < F _ {\ mathrm {crit}} $ entonces automáticamente $ p > 0.05 $. En consecuencia, si $ F \ geq F _ {\ mathrm {crit}} $ entonces automáticamente $ p \ leq 0.05 $. Alternativamente, si $ p \ leq 0.05 $ entonces $ F \ geq F _ {\ mathrm {crit}} $ y si $ p > 0.05 $ entonces $ F < F _ {\ mathrm {crit}} $. Además, bajo ninguna circunstancia se puede decir que las dos poblaciones de las que se extrajeron las muestras tienen variaciones iguales. Si las muestras en sí tienen variaciones iguales, puede saberlo con solo mirar los números; no ' no necesita una prueba para eso, pero cuando difieren, no ' No te digo mucho de interés.

Responde

Si quieres saber más sobre el significado y cálculo de la prueba F cuando se usa como criterio para el análisis de varianza (ANOVA) con ejemplos en Excel, recomiendo esta serie de cuatro artículos.La fórmula final puede tener en cuenta el tamaño de alfa, el número de grados de libertad para el numerador y denominador de la relación F y el parámetro de no centralidad.

  1. El concepto de poder estadístico – http://www.informit.com/articles/article.aspx?p=2036566
  2. El poder estadístico de las pruebas t – http://www.informit.com/articles/article.aspx?p=2036565
  3. El parámetro de no centralidad en la distribución F – http://www.informit.com/articles/article.aspx?p=2036567
  4. Cálculo de la potencia de la prueba F – http://www.informit.com/articles/article.aspx?p=2036568

Respuesta

Importante: asegúrese de que la varianza de la Variable 1 sea mayor que la varianza de la Variable 2. Si no es así, intercambie sus datos. Como resultado, Excel calcula el valor F correcto, que es la razón de Varianza 1 a Varianza 2 (F = Var1 / Var 2).

Conclusión: si F> F crítica de una cola, rechazamos la hipótesis nula. Eso significa que las variaciones de las dos poblaciones son desiguales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *