Suponha que temos o seguinte conjunto de dados:
Men Women Dieting 10 30 Non-dieting 5 60
Se Eu executo o teste exato de Fisher em R, então o que alternative = greater
(ou menos) implica? Por exemplo:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Eu obtenho p-value = 0.01588
e odds ratio = 3.943534
. Além disso, quando eu viro as linhas da tabela de contingência desta forma:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
então eu obtenho o p-value = 0.9967
e odds ratio = 0.2535796
. Mas, quando executo as duas tabelas de contingência sem o argumento alternativo (ou seja, fisher.test(mat)
), obtenho o p-value = 0.02063
.
- Você poderia me explicar o motivo?
- Além disso, qual é a hipótese nula e a hipótese alternativa nos casos acima?
-
Posso executar o teste de Fisher em uma tabela de contingência como esta:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: Não sou estatístico. Estou tentando aprender estatística, então sua ajuda (respostas em inglês simples) seria muito apreciada.
Resposta
greater
(ou less
) refere-se a um teste unilateral comparando uma hipótese nula de que p1=p2
com a alternativa p1>p2
(ou p1<p2
). Em contraste, um teste bilateral compara a hipótese nula à alternativa de que p1
não é igual a p2
.
Para sua tabela, a proporção de homens que fazem dieta é 1/4 = 0,25 (10 em 40) em sua amostra. Por outro lado, a proporção de homens que não fazem dieta é 1/13 ou (5 em 65) igual a 0,077 na amostra. Portanto, a estimativa para p1
é 0,25 e para p2
é 0,077. Portanto, parece que p1>p2
.
É por isso que para a alternativa unilateral p1>p2
o valor p é 0,01588. (Valores p pequenos indicam que a hipótese nula é improvável e a alternativa é provável.)
Quando a alternativa é p1<p2
, vemos que seus dados indicam que a diferença está na direção errada (ou não prevista).
É por isso que, nesse caso, o valor p é tão alto 0,9967. Para a alternativa de dois lados, o valor p deve ser um pouco maior do que para a alternativa de um lado p1>p2
. E, de fato, é com valor de p igual a 0,02063.
Comentários
- Explicação fantástica. Então, o teste exato de fisher realmente compara as probabilidades entre linhas em oposição a colunas?
- @Christian: Não, não ' importa se suas linhas ou colunas são o teste de Fisher verifica a correlação em uma tabela de contingência. Linhas e colunas não ' importam diretamente. Você também pode apenas reformular a hipótese: em vez de H0 ser " pessoas que fumam morrem mais jovens ", você também pode estar assumindo H0: " pessoas que morrem mais jovens têm maior probabilidade de fumar ". Os resultados do teste de Fisher diriam se alguma conexão observada nos dados suporta a hipótese nula ou não, mas não ' importa qual é a variável independente ou dependente e igualmente a escolha de linhas / colunas não ' importa 🙂