Estoy estudiando Estadística para ciencia de datos desde hace unos meses ..

1) Estoy aprendiendo que, cuando tenemos que comparar múltiples muestras (> 2), entonces una prueba T sería tediosa y en su lugar optamos por ANOVA y realizamos una «Prueba F».

2) La comprensión anterior crea un «requisito mutuamente excluyente entre la prueba F y la prueba T».

3) También aprendí que, la prueba T (ya sea: 1 muestra / pareada / 2 muestra) básicamente prueba las diferencias en las medias, mientras que la «prueba F» prueba las diferencias en las varianzas.

4) Ahora, suponga que dos grupos de muestras tienen medias casi iguales pero varianzas muy diferentes, entonces , ambas pruebas darían respuestas diferentes, ¿verdad?

La prueba T diría «no son diferentes». Pero la «prueba F» diría «son diferentes».

O incluso para un caso inverso. (medias enormemente diferentes, pero casi las mismas variaciones) ..

5) Entonces, basándonos en qué, (¿la media o la variación?) finalmente vamos a decidir su verdadera diferencia.

6) Entonces la pregunta es: ¿Cómo se relacionan? Si el objetivo original era descubrir que dos o más muestras son diferentes o no, entonces cómo «buscar medias» (es decir, elegir la prueba T) para un número más pequeño de grupos de muestras, se cambia a «buscar varianzas» cuando no hay grupos de muestras son> 2? (Cuando el hecho es: la varianza y la media son básicamente características independientes de un grupo de muestra)

7) ¿No deberían comprobarse estas dos métricas para encontrar si realmente las dos muestras son diferentes o no?

(He mencionado los números de serie de los puntos que he indicado. Por favor, señale si alguno de ellos es un entendimiento básicamente incorrecto. Agradecería que se dieran respuestas para cada punto)

Comentarios

  • ¿Qué quiere decir exactamente con » comparar muestras «? ¿Estás hablando de comparar si la media de la población a la que vienen es la misma / diferente? ¿O estás hablando de comprobar si su distribución es la misma / diferente?
  • ¡¡No estoy seguro !! ¡Porque eso es lo que quiero saber! ¿No deberíamos buscar ambos para decidir » esos dos grupos de muestra son diferentes o no » en todos los aspectos? No pude encontrar ningún tutorial que resaltara esta vista. La mayoría de los tutoriales explican como » … para comparar más de dos grupos, vaya a la prueba F .. .. «. Esa vez, el punto de vista cambia de » mirando la media » a » mirando las variaciones. !! » .. ¡Por lo tanto, no tengo claro esto!
  • Como nuevo estudiante de estadística, ¡no sé qué buscar! .. de los tutoriales dicen .. » prueba T O prueba F » .. ninguno de los tutoriales dice » comprobar tanto T como F !! (Mi opinión: ¿No deberíamos ‘ t mirar desde ambos ángulos? (es decir, las medias y las variaciones)?
  • El siguiente enlace va allí: Ya lo he referido. Pero no responde exactamente a mi pregunta): stats.stackexchange.com/questions/78150/…
  • Bueno, hacer una » prueba » es encontrar la respuesta a una pregunta. ¡Lo primero que debe saber es cuál es la pregunta real!

Respuesta

Los términos prueba t y la prueba F son ambiguas, porque cualquier prueba donde el estadístico de prueba tiene una distribución t (bajo la hipótesis nula) se llama prueba t y cualquier prueba donde el estadístico de prueba tiene una distribución F se llama prueba F. Hay más de una instancia de estos.

Esto es relevante para su pregunta porque hay una prueba F que compara las varianzas de dos muestras, pero esta no es la F -prueba utilizada en el análisis ANOVA estándar. De hecho, la prueba F de ANOVA compara la variabilidad entre grupos y dentro de los grupos, y la variabilidad entre grupos se mide de hecho cuadrando y sumando las diferencias entre las medias de los grupos, por lo que en esta configuración tanto las pruebas t como las F se tratan de comparar medios de grupo. De hecho, si solo tiene dos grupos / niveles de factor, el estadístico de la prueba F es el cuadrado del estadístico de la prueba t, y la prueba F es equivalente a la prueba t de dos lados. Para más de dos grupos, el problema con las pruebas t es que la prueba t solo puede comparar dos grupos a la vez, lo que significa que necesitará varias pruebas t para comparar todos los grupos, lo que implica problemas con pruebas múltiples (es decir, si probar varias hipótesis al nivel del 5%, la probabilidad de encontrar al menos una significancia incorrecta suponiendo que todas las hipótesis nulas son verdaderas puede ser sustancialmente superior al 5%).

Además, tiene razón en que uno puede estar interesado en explorar tanto las diferencias entre las medias como las diferencias entre las variaciones, y los grupos con la misma media pueden tener variaciones diferentes. De hecho, puede verificarlos a ambos, aunque esto nuevamente implica múltiples pruebas; no hay almuerzo gratis. En muchas aplicaciones de ANOVA es bastante razonable suponer varianzas iguales, o solo las diferencias medias son de interés sustancial (por ejemplo, solo se pregunta si un grupo se desempeña «mejor» que otro), por lo tanto, diferencias en las varianzas a menudo no se investigan explícitamente (me abstendré de una declaración sobre si esto sería «bueno» o «correcto»; o más bien mi respuesta sería «depende» …).

Comentarios

  • Gracias por la explicación

Responder

Si están comparando más de dos grupos y están interesados en comparar sus medias, entonces es habitual hacer ANOVA como usted dice, lo que prueba la hipótesis de que todas las medias de los grupos son iguales. / span> -tests no es del todo equivalente porque cada prueba solo prueba si las medias en esos dos grupos son iguales. Su punto 1)

El uso de $ Prueba F $ ac Se utiliza ompare varianzas porque lo que se compara en ANOVA es la varianza entre las medias del grupo y la varianza dentro de los grupos. (Su punto 3)

El resto de sus preguntas son difíciles de responder porque, vea mis puntos anteriores, creo que tiene algunos conceptos erróneos sobre lo que está sucediendo.

Respuesta

Considere esta fórmula

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. desde el punto de vista de la practicidad esto podría ser cierto, correcto.

2.Si tiene un grupo de control y un grupo tratado de la misma población, entonces serán los mismos. Pero digamos que si tiene niños frente a niñas, ubicación1 frente a ubicación2, podrían ser diferentes.

  1. Correcto.
  2. Posiblemente
  3. Según tu objetivo. Si simplemente desea saber si el grupo tiene características diferentes (como el promedio), haga la prueba t. Si desea saber si ciertos factores aplicados (como diferentes niveles de nicotina del cigarrillo) tienen efectos significativos, utilice la prueba F.
  4. La fórmula está relacionada pero la aplicación difiere según su objetivo. .

  5. No. ya que no tiene ningún sentido ya que las pruebas t y F tienen un objetivo o problema diferente que están resolviendo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *