Supposons que nous ayons lensemble de données suivant:
Men Women Dieting 10 30 Non-dieting 5 60
Si Jexécute le test exact de Fisher dans R alors que signifie alternative = greater
(ou moins)? Par exemple:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Jobtiens p-value = 0.01588
et odds ratio = 3.943534
. De plus, lorsque je retourne les lignes du tableau de contingence comme ceci:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
alors jobtiens le p-value = 0.9967
et odds ratio = 0.2535796
. Mais, lorsque jexécute le tableau de deux contingences sans largument alternatif (cest-à-dire fisher.test(mat)
), alors jobtiens le p-value = 0.02063
.
- Pouvez-vous men expliquer la raison?
- Aussi, quelle est lhypothèse nulle et lhypothèse alternative dans les cas ci-dessus?
-
Puis-je exécuter le test de Fisher sur une table de contingence comme celle-ci:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: Je ne suis pas statisticien. Jessaie dapprendre des statistiques afin que votre aide (réponses en anglais simple) soit très appréciée.
Réponse
greater
(ou less
) fait référence à un test unilatéral comparant une hypothèse nulle que p1=p2
à lalternative p1>p2
(ou p1<p2
). En revanche, un test bilatéral compare les hypothèses nulles à lalternative selon laquelle p1
nest pas égal à p2
.
Pour votre tableau, la proportion de personnes au régime qui sont des hommes est de 1/4 = 0,25 (10 sur 40) dans votre échantillon. En revanche, la proportion dhommes non au régime est de 1/13 ou (5 sur 65) égale à 0,077 dans léchantillon. Ainsi, lestimation pour p1
est de 0,25 et pour p2
est de 0,077. Par conséquent, il semble que p1>p2
.
Cest pourquoi pour lalternative unilatérale p1>p2
la valeur p est 0,01588. (De petites valeurs p indiquent que lhypothèse nulle est peu probable et que lalternative est probable.)
Lorsque lalternative est p1<p2
, nous voyons que vos données indiquent que la différence est dans la mauvaise direction (ou imprévue).
Cest pourquoi, dans ce cas, la valeur p est si élevée à 0,9967. Pour lalternative bilatérale, la valeur de p doit être un peu plus élevée que pour lalternative unilatérale p1>p2
. Et en effet, cest avec une valeur p égale à 0,02063.
Commentaires
- Explication fantastique. Donc, le test Fisher exact compare en fait les probabilités entre les lignes et non entre les colonnes?
- @Christian: Non, ' t importe si ses lignes ou ses colonnes sont le test de Fisher vérifie la corrélation dans un tableau de contingence. Les lignes et les colonnes n’ont pas ' d’importance directe. Vous pouvez également simplement reformuler lhypothèse: à la place H0 étant " les personnes qui fument meurent plus jeunes " vous pouvez également supposer H0: " les personnes qui meurent plus jeunes sont plus susceptibles de fumer ". Les résultats du test de Fisher vous indiqueraient si une connexion observée dans les données prend en charge lhypothèse nulle ou non, mais cela na pas ' quelle est la variable indépendante ou dépendante et également le choix des lignes / colonnes na ' pas dimportance 🙂