Supongamos que tenemos el siguiente conjunto de datos:
Men Women Dieting 10 30 Non-dieting 5 60
Si Ejecuto la prueba exacta de Fisher en R, entonces, ¿qué implica alternative = greater
(o menos)? Por ejemplo:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Obtengo p-value = 0.01588
y odds ratio = 3.943534
. Además, cuando volteo las filas de la tabla de contingencia de esta manera:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
entonces obtengo el p-value = 0.9967
y odds ratio = 0.2535796
. Pero, cuando ejecuto la tabla de dos contingencias sin el argumento alternativo (es decir, fisher.test(mat)
), obtengo el p-value = 0.02063
.
- ¿Podría explicarme el motivo?
- Además, ¿cuál es la hipótesis nula y la hipótesis alternativa en los casos anteriores?
-
¿Puedo ejecutar la prueba de Fisher en una tabla de contingencia como esta:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PD: No soy un estadístico. Estoy tratando de aprender estadísticas para que su ayuda (respuestas en inglés simple) sea muy apreciada.
Respuesta
greater
(o less
) se refiere a una prueba unilateral que compara una hipótesis nula de que p1=p2
con la alternativa p1>p2
(o p1<p2
). Por el contrario, una prueba de dos caras compara las hipótesis nulas con la alternativa de que p1
no es igual a p2
.
Para su tabla, la proporción de personas que hacen dieta que son hombres es 1/4 = 0.25 (10 de 40) en su muestra. Por otro lado, la proporción de hombres que no hacen dieta es 1/13 o (5 de 65) igual a 0.077 en la muestra. Entonces, la estimación para p1
es 0.25 y para p2
es 0.077. Por lo tanto, parece que p1>p2
.
Es por eso que para la alternativa unilateral p1>p2
el valor p es 0.01588. (Los valores p pequeños indican que la hipótesis nula es poco probable y la alternativa es probable).
Cuando la alternativa es p1<p2
, vemos que sus datos indicaron que la diferencia está en la dirección incorrecta (o no anticipada).
Es por eso que en ese caso el valor p es tan alto 0.9967. Para la alternativa de dos lados, el valor p debería ser un poco más alto que para la alternativa de un solo lado p1>p2
. Y de hecho, es con un valor de p igual a 0.02063.
Comentarios
- Fantástica explicación. Entonces, ¿la prueba exacta de Fisher realmente compara probabilidades entre filas en lugar de columnas?
- @Christian: No, no ' importa si sus filas o columnas son la prueba de Fisher comprueba la correlación en una tabla de contingencia. Las filas y columnas no ' importan directamente. También podrías reformular la hipótesis: en lugar de que H0 sea " las personas que fuman mueren más jóvenes ", también podrías asumir H0: " las personas que mueren antes son más propensas a fumar ". Los resultados de la prueba de Fisher le dirían si alguna conexión observada en los datos respalda la hipótesis nula o no, pero no ' t importa cuál es la variable independiente o dependiente e igualmente la elección de filas / columnas no ' no importa 🙂