Suponha que temos o seguinte conjunto de dados:

 Men Women Dieting 10 30 Non-dieting 5 60 

Se Eu executo o teste exato de Fisher em R, então o que alternative = greater (ou menos) implica? Por exemplo:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Eu obtenho p-value = 0.01588 e odds ratio = 3.943534 . Além disso, quando eu viro as linhas da tabela de contingência desta forma:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

então eu obtenho o p-value = 0.9967 e odds ratio = 0.2535796. Mas, quando executo as duas tabelas de contingência sem o argumento alternativo (ou seja, fisher.test(mat)), obtenho o p-value = 0.02063.

  1. Você poderia me explicar o motivo?
  2. Além disso, qual é a hipótese nula e a hipótese alternativa nos casos acima?
  3. Posso executar o teste de Fisher em uma tabela de contingência como esta:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Não sou estatístico. Estou tentando aprender estatística, então sua ajuda (respostas em inglês simples) seria muito apreciada.

Resposta

greater (ou less) refere-se a um teste unilateral comparando uma hipótese nula de que p1=p2 com a alternativa p1>p2 (ou p1<p2). Em contraste, um teste bilateral compara a hipótese nula à alternativa de que p1 não é igual a p2.

Para sua tabela, a proporção de homens que fazem dieta é 1/4 = 0,25 (10 em 40) em sua amostra. Por outro lado, a proporção de homens que não fazem dieta é 1/13 ou (5 em 65) igual a 0,077 na amostra. Portanto, a estimativa para p1 é 0,25 e para p2 é 0,077. Portanto, parece que p1>p2.

É por isso que para a alternativa unilateral p1>p2 o valor p é 0,01588. (Valores p pequenos indicam que a hipótese nula é improvável e a alternativa é provável.)

Quando a alternativa é p1<p2, vemos que seus dados indicam que a diferença está na direção errada (ou não prevista).

É por isso que, nesse caso, o valor p é tão alto 0,9967. Para a alternativa de dois lados, o valor p deve ser um pouco maior do que para a alternativa de um lado p1>p2. E, de fato, é com valor de p igual a 0,02063.

Comentários

  • Explicação fantástica. Então, o teste exato de fisher realmente compara as probabilidades entre linhas em oposição a colunas?
  • @Christian: Não, não ' importa se suas linhas ou colunas são o teste de Fisher verifica a correlação em uma tabela de contingência. Linhas e colunas não ' importam diretamente. Você também pode apenas reformular a hipótese: em vez de H0 ser " pessoas que fumam morrem mais jovens ", você também pode estar assumindo H0: " pessoas que morrem mais jovens têm maior probabilidade de fumar ". Os resultados do teste de Fisher diriam se alguma conexão observada nos dados suporta a hipótese nula ou não, mas não ' importa qual é a variável independente ou dependente e igualmente a escolha de linhas / colunas não ' importa 🙂

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *