Antag, at vi har følgende datasæt:
Men Women Dieting 10 30 Non-dieting 5 60
Hvis Jeg kører Fisher nøjagtig test i R, hvad betyder alternative = greater
(eller mindre)? For eksempel:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Jeg får p-value = 0.01588
og odds ratio = 3.943534
. Når jeg vender rækkerne i beredskabstabellen således:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
så får jeg p-value = 0.9967
og odds ratio = 0.2535796
. Men når jeg kører de to beredskabstabeller uden det alternative argument (dvs. fisher.test(mat)
), får jeg p-value = 0.02063
.
- Kan du venligst forklare årsagen til mig?
- Hvad er også nulhypotesen og den alternative hypotese i ovenstående tilfælde?
-
Kan jeg køre fisher-testen på en beredskabstabel som denne:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: Jeg er ikke statistiker. Jeg prøver at lære statistik, så din hjælp (svar på enkel engelsk) ville blive meget værdsat.
Svar
greater
(eller less
) henviser til en ensidig test, der sammenligner en nulhypotese om, at p1=p2
til alternativet p1>p2
(eller p1<p2
). I modsætning hertil sammenligner en tosidet test nulhypoteserne med alternativet, at p1
ikke er lig med p2
.
For din tabel er andelen slankekure, der er mænd, 1/4 = 0,25 (10 ud af 40) i din prøve. På den anden side er andelen af ikke-slankekure, der er mænd, 1/13 eller (5 ud af 65) lig med 0,077 i prøven. Så estimatet for p1
er 0,25 og for p2
er 0,077. Derfor ser det ud til, at p1>p2
.
Derfor er p-værdien for det ensidige alternativ p1>p2
0,01588. (Små p-værdier indikerer, at nulhypotesen er usandsynlig, og alternativet sandsynligvis.)
Når alternativet er p1<p2
, ser vi, at dine data viste, at forskellen er i den forkerte (eller uventede) retning.
Derfor er p-værdien i så fald 0,9967 så høj. For det tosidede alternativ skal p-værdien være lidt højere end for det ensidige alternativ p1>p2
. Og faktisk er det med p-værdi lig med 0,02063.
Kommentarer
- Fantastisk forklaring. Fishers nøjagtige test sammenligner faktisk sandsynligheder mellem rækker i modsætning til kolonner?
- @Christian: Nej, det betyder ikke ' om dens rækker eller kolonner som fiskertesten kontrollerer for sammenhæng i en beredskabstabel. Rækker og kolonner betyder ikke ' noget direkte. Du kan også bare omformulere hypotesen: I stedet for at H0 er " mennesker, der ryger, dør yngre ", kan du også antage H0: " mennesker, der dør yngre, er mere tilbøjelige til at ryge ". Resultaterne af fisher-testen fortæller dig, om nogen observeret forbindelse i dataene understøtter nulhypotesen eller ej, men det betyder ikke ' t, som er den uafhængige eller afhængige variabel og lige valget af rækker / kolonner betyder ikke ' t betyder 🙂