Tegyük fel, hogy a következő adathalmaz van:

 Men Women Dieting 10 30 Non-dieting 5 60 

Ha Futtatom a Fisher pontos tesztet R-ben, akkor mit jelent alternative = greater (vagy kevesebb)? Például:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Megkapom a p-value = 0.01588 és odds ratio = 3.943534 . Továbbá, amikor a kontingenciatáblázat sorait így átfordítom:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

, akkor megkapom a p-value = 0.9967 és odds ratio = 0.2535796. De amikor az alternatív argumentum (azaz fisher.test(mat)) nélkül futtatom a két kontingenciatáblát, akkor megkapom a p-value = 0.02063 parancsot.

  1. Meg tudná magyarázni nekem az okát?
  2. Ezenkívül mi a nullhipotézis és az alternatív hipotézis a fenti esetekben?
  3. Futtathatom-e a horgász tesztet egy ilyen kontingencia táblán: div id = “57ec799a66″>

PS: Nem vagyok statisztikus. Statisztikákat próbálok megtanulni, hogy a segítségét (egyszerű angol nyelvű válaszokkal) nagyra értékeljük.

Válasz

greater (vagy less) egyoldalú tesztre utal, amely összehasonlítja a null rész hipotézisét, amely szerint p1=p2 az p1>p2 (vagy ). Ezzel szemben egy kétoldalas teszt összehasonlítja a nullhipotéziseket azzal az alternatívával, hogy a p1 nem egyenlő a p2

Az Ön táblázatában a férfi fogyókúrázók aránya 1/4 = 0,25 (40-ből 10) a mintában. Másrészt a nem diétázók hím férfiak aránya 1/13 vagy (65-ből 5) 0,077 a mintában. Tehát akkor a p1 becsült értéke 0,25, a p2 esetében pedig 0,077. Ezért úgy tűnik, hogy p1>p2.

Éppen ezért az egyoldalas p1>p2 alternatíva esetén a p-érték 0,01588. (A kis p-értékek azt jelzik, hogy a nullhipotézis valószínűtlen, és az alternatíva valószínű.)

Ha az alternatíva p1<p2, akkor azt látjuk, hogy az adatai azt jelzik, hogy a különbség rossz (vagy nem várt) irányba mutat.

Éppen ezért ebben az esetben a p-érték olyan magas 0,9967. A kétoldalas alternatíva esetén a p-értéknek valamivel magasabbnak kell lennie, mint az egyoldalas p1>p2 alternatívának. És valóban, értéke 0,02063.

Megjegyzések

  • Fantasztikus magyarázat. Tehát a halász pontos tesztje valójában összehasonlítja a sorok közötti valószínűségeket az oszlopokkal szemben?
  • @Christian: Nem, nem számít, hogy ' a halász-teszt a korrelációt ellenőrzi egy vészhelyzeti táblázatban. A sorok és oszlopok nem számítanak közvetlenül a ' nek. Csak megfogalmazhatná a hipotézist: ehelyett H0 " dohányzó emberek fiatalabban halnak meg ", azt is feltételezheti, hogy H0: " a fiatalabban meghaló emberek nagyobb valószínűséggel dohányoznak ". A fisher teszt eredményei megmondanák, hogy az adatokban megfigyelt bármely kapcsolat alátámasztja-e a nullhipotézist, vagy sem, de nem számít ' ez, amely független vagy függő változó, és ugyanúgy a sorok / oszlopok választása nem számít ' nek 🙂 🙂

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük