Stel dat we de volgende dataset hebben:
Men Women Dieting 10 30 Non-dieting 5 60
Als Ik voer de Fisher exact-test uit in R, wat betekent dan alternative = greater
(of minder)? Bijvoorbeeld:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Ik krijg de p-value = 0.01588
en odds ratio = 3.943534
. Als ik de rijen van de kruistabel als volgt omdraai:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
, dan krijg ik de p-value = 0.9967
en odds ratio = 0.2535796
. Maar als ik de twee kruistabellen uitvoer zonder het alternatieve argument (d.w.z. fisher.test(mat)
), dan krijg ik de p-value = 0.02063
.
- Kunt u mij de reden uitleggen?
- Wat is ook de nulhypothese en alternatieve hypothese in de bovenstaande gevallen?
-
Kan ik de Fisher-test op een kruistabel als volgt uitvoeren:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: ik ben geen statisticus. Ik probeer statistieken te leren, zodat uw hulp (antwoorden in eenvoudig Engels) zeer op prijs wordt gesteld.
Antwoord
greater
(of less
) verwijst naar een eenzijdige test die een nulhypothese vergelijkt dat p1=p2
naar het alternatief p1>p2
(of p1<p2
). Een tweezijdige test daarentegen vergelijkt de nulhypothesen met het alternatief dat p1
niet gelijk is aan p2
.
Voor uw tafel is het aandeel mannelijke lijners 1/4 = 0,25 (10 van de 40) in uw steekproef. Aan de andere kant is het percentage mannen dat geen dieet volgt, 1/13 of (5 van de 65) gelijk aan 0,077 in de steekproef. Dus de schatting voor p1
is 0,25 en voor p2
0,077. Daarom lijkt het erop dat p1>p2
.
Daarom is voor het eenzijdige alternatief p1>p2
de p-waarde 0,01588. (Kleine p-waarden geven aan dat de nulhypothese onwaarschijnlijk is en het alternatief waarschijnlijk.)
Als het alternatief p1<p2
is, zien we dat uw gegevens erop wijzen dat het verschil is in de verkeerde (of onverwachte) richting.
Daarom is in dat geval de p-waarde zo hoog 0,9967. Voor het tweezijdige alternatief zou de p-waarde iets hoger moeten zijn dan voor het eenzijdige alternatief p1>p2
. En inderdaad, het is met een p-waarde gelijk aan 0,02063.
Reacties
- Fantastische uitleg. De exacte test van Fisher vergelijkt dus eigenlijk kansen tussen rijen in plaats van kolommen?
- @Christian: Nee, het maakt niet uit of ' de rijen of kolommen zijn als de Fisher-test controleert op correlatie in een kruistabel. Rijen en kolommen doen ' niet rechtstreeks toe. Je zou ook gewoon de hypothese kunnen herformuleren: in plaats daarvan is H0 " mensen die roken, sterven jonger " je zou ook kunnen uitgaan van H0: " mensen die jonger sterven, roken eerder ". De resultaten van de Fisher-test zouden u vertellen of een waargenomen connectie in de gegevens de nulhypothese ondersteunt of niet, maar het doet er niet toe wat de onafhankelijke of afhankelijke variabele is en evenzeer de ' de keuze van rijen / kolommen doet niet ' er toe 🙂