Antag, at vi har følgende datasæt:

 Men Women Dieting 10 30 Non-dieting 5 60 

Hvis Jeg kører Fisher nøjagtig test i R, hvad betyder alternative = greater (eller mindre)? For eksempel:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Jeg får p-value = 0.01588 og odds ratio = 3.943534 . Når jeg vender rækkerne i beredskabstabellen således:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

så får jeg p-value = 0.9967 og odds ratio = 0.2535796. Men når jeg kører de to beredskabstabeller uden det alternative argument (dvs. fisher.test(mat)), får jeg p-value = 0.02063.

  1. Kan du venligst forklare årsagen til mig?
  2. Hvad er også nulhypotesen og den alternative hypotese i ovenstående tilfælde?
  3. Kan jeg køre fisher-testen på en beredskabstabel som denne:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Jeg er ikke statistiker. Jeg prøver at lære statistik, så din hjælp (svar på enkel engelsk) ville blive meget værdsat.

Svar

greater (eller less) henviser til en ensidig test, der sammenligner en nulhypotese om, at p1=p2 til alternativet p1>p2 (eller p1<p2). I modsætning hertil sammenligner en tosidet test nulhypoteserne med alternativet, at p1 ikke er lig med p2.

For din tabel er andelen slankekure, der er mænd, 1/4 = 0,25 (10 ud af 40) i din prøve. På den anden side er andelen af ikke-slankekure, der er mænd, 1/13 eller (5 ud af 65) lig med 0,077 i prøven. Så estimatet for p1 er 0,25 og for p2 er 0,077. Derfor ser det ud til, at p1>p2.

Derfor er p-værdien for det ensidige alternativ p1>p2 0,01588. (Små p-værdier indikerer, at nulhypotesen er usandsynlig, og alternativet sandsynligvis.)

Når alternativet er p1<p2, ser vi, at dine data viste, at forskellen er i den forkerte (eller uventede) retning.

Derfor er p-værdien i så fald 0,9967 så høj. For det tosidede alternativ skal p-værdien være lidt højere end for det ensidige alternativ p1>p2. Og faktisk er det med p-værdi lig med 0,02063.

Kommentarer

  • Fantastisk forklaring. Fishers nøjagtige test sammenligner faktisk sandsynligheder mellem rækker i modsætning til kolonner?
  • @Christian: Nej, det betyder ikke ' om dens rækker eller kolonner som fiskertesten kontrollerer for sammenhæng i en beredskabstabel. Rækker og kolonner betyder ikke ' noget direkte. Du kan også bare omformulere hypotesen: I stedet for at H0 er " mennesker, der ryger, dør yngre ", kan du også antage H0: " mennesker, der dør yngre, er mere tilbøjelige til at ryge ". Resultaterne af fisher-testen fortæller dig, om nogen observeret forbindelse i dataene understøtter nulhypotesen eller ej, men det betyder ikke ' t, som er den uafhængige eller afhængige variabel og lige valget af rækker / kolonner betyder ikke ' t betyder 🙂

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *