Supongamos que tenemos el siguiente conjunto de datos:

 Men Women Dieting 10 30 Non-dieting 5 60 

Si Ejecuto la prueba exacta de Fisher en R, entonces, ¿qué implica alternative = greater (o menos)? Por ejemplo:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Obtengo p-value = 0.01588 y odds ratio = 3.943534 . Además, cuando volteo las filas de la tabla de contingencia de esta manera:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

entonces obtengo el p-value = 0.9967 y odds ratio = 0.2535796. Pero, cuando ejecuto la tabla de dos contingencias sin el argumento alternativo (es decir, fisher.test(mat)), obtengo el p-value = 0.02063.

  1. ¿Podría explicarme el motivo?
  2. Además, ¿cuál es la hipótesis nula y la hipótesis alternativa en los casos anteriores?
  3. ¿Puedo ejecutar la prueba de Fisher en una tabla de contingencia como esta:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PD: No soy un estadístico. Estoy tratando de aprender estadísticas para que su ayuda (respuestas en inglés simple) sea muy apreciada.

Respuesta

greater (o less) se refiere a una prueba unilateral que compara una hipótesis nula de que p1=p2 con la alternativa p1>p2 (o p1<p2). Por el contrario, una prueba de dos caras compara las hipótesis nulas con la alternativa de que p1 no es igual a p2.

Para su tabla, la proporción de personas que hacen dieta que son hombres es 1/4 = 0.25 (10 de 40) en su muestra. Por otro lado, la proporción de hombres que no hacen dieta es 1/13 o (5 de 65) igual a 0.077 en la muestra. Entonces, la estimación para p1 es 0.25 y para p2 es 0.077. Por lo tanto, parece que p1>p2.

Es por eso que para la alternativa unilateral p1>p2 el valor p es 0.01588. (Los valores p pequeños indican que la hipótesis nula es poco probable y la alternativa es probable).

Cuando la alternativa es p1<p2, vemos que sus datos indicaron que la diferencia está en la dirección incorrecta (o no anticipada).

Es por eso que en ese caso el valor p es tan alto 0.9967. Para la alternativa de dos lados, el valor p debería ser un poco más alto que para la alternativa de un solo lado p1>p2. Y de hecho, es con un valor de p igual a 0.02063.

Comentarios

  • Fantástica explicación. Entonces, ¿la prueba exacta de Fisher realmente compara probabilidades entre filas en lugar de columnas?
  • @Christian: No, no ' importa si sus filas o columnas son la prueba de Fisher comprueba la correlación en una tabla de contingencia. Las filas y columnas no ' importan directamente. También podrías reformular la hipótesis: en lugar de que H0 sea " las personas que fuman mueren más jóvenes ", también podrías asumir H0: " las personas que mueren antes son más propensas a fumar ". Los resultados de la prueba de Fisher le dirían si alguna conexión observada en los datos respalda la hipótesis nula o no, pero no ' t importa cuál es la variable independiente o dependiente e igualmente la elección de filas / columnas no ' no importa 🙂

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *