Stel dat we de volgende dataset hebben:

 Men Women Dieting 10 30 Non-dieting 5 60 

Als Ik voer de Fisher exact-test uit in R, wat betekent dan alternative = greater (of minder)? Bijvoorbeeld:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Ik krijg de p-value = 0.01588 en odds ratio = 3.943534 . Als ik de rijen van de kruistabel als volgt omdraai:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

, dan krijg ik de p-value = 0.9967 en odds ratio = 0.2535796. Maar als ik de twee kruistabellen uitvoer zonder het alternatieve argument (d.w.z. fisher.test(mat)), dan krijg ik de p-value = 0.02063.

  1. Kunt u mij de reden uitleggen?
  2. Wat is ook de nulhypothese en alternatieve hypothese in de bovenstaande gevallen?
  3. Kan ik de Fisher-test op een kruistabel als volgt uitvoeren:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: ik ben geen statisticus. Ik probeer statistieken te leren, zodat uw hulp (antwoorden in eenvoudig Engels) zeer op prijs wordt gesteld.

Antwoord

greater (of less) verwijst naar een eenzijdige test die een nulhypothese vergelijkt dat p1=p2 naar het alternatief p1>p2 (of p1<p2). Een tweezijdige test daarentegen vergelijkt de nulhypothesen met het alternatief dat p1 niet gelijk is aan p2.

Voor uw tafel is het aandeel mannelijke lijners 1/4 = 0,25 (10 van de 40) in uw steekproef. Aan de andere kant is het percentage mannen dat geen dieet volgt, 1/13 of (5 van de 65) gelijk aan 0,077 in de steekproef. Dus de schatting voor p1 is 0,25 en voor p2 0,077. Daarom lijkt het erop dat p1>p2.

Daarom is voor het eenzijdige alternatief p1>p2 de p-waarde 0,01588. (Kleine p-waarden geven aan dat de nulhypothese onwaarschijnlijk is en het alternatief waarschijnlijk.)

Als het alternatief p1<p2 is, zien we dat uw gegevens erop wijzen dat het verschil is in de verkeerde (of onverwachte) richting.

Daarom is in dat geval de p-waarde zo hoog 0,9967. Voor het tweezijdige alternatief zou de p-waarde iets hoger moeten zijn dan voor het eenzijdige alternatief p1>p2. En inderdaad, het is met een p-waarde gelijk aan 0,02063.

Reacties

  • Fantastische uitleg. De exacte test van Fisher vergelijkt dus eigenlijk kansen tussen rijen in plaats van kolommen?
  • @Christian: Nee, het maakt niet uit of ' de rijen of kolommen zijn als de Fisher-test controleert op correlatie in een kruistabel. Rijen en kolommen doen ' niet rechtstreeks toe. Je zou ook gewoon de hypothese kunnen herformuleren: in plaats daarvan is H0 " mensen die roken, sterven jonger " je zou ook kunnen uitgaan van H0: " mensen die jonger sterven, roken eerder ". De resultaten van de Fisher-test zouden u vertellen of een waargenomen connectie in de gegevens de nulhypothese ondersteunt of niet, maar het doet er niet toe wat de onafhankelijke of afhankelijke variabele is en evenzeer de ' de keuze van rijen / kolommen doet niet ' er toe 🙂

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *