Oletetaan, että meillä on seuraava datajoukko:
Men Women Dieting 10 30 Non-dieting 5 60
Jos Suoritan Fisherin tarkan testin R: ssä, mitä sitten alternative = greater
(tai vähemmän) tarkoittaa? Esimerkiksi:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Saan p-value = 0.01588
ja odds ratio = 3.943534
. Lisäksi kun käännän varautumistaulukon rivejä näin:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
saan p-value = 0.9967
ja odds ratio = 0.2535796
. Mutta kun suoritan kaksi varautumataulukkoa ilman vaihtoehtoista argumenttia (ts. fisher.test(mat)
), saan p-value = 0.02063
.
- Voisitteko selittää syyn minulle?
- Mikä on myös nullhypoteesi ja vaihtoehtoinen hypoteesi edellä mainituissa tapauksissa?
-
Voinko suorittaa kalastajakokeen tällaisella taulukkolla:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: En ole tilastotieteilijä. Yritän oppia tilastoja, jotta apuasi (vastaukset yksinkertaisella englanniksi) olisi erittäin arvostettua.
vastaus
greater
(tai less
) viittaa yksipuoliseen testiin, jossa verrataan nollahypoteesia p1=p2
vaihtoehtoiseen p1>p2
(tai p1<p2
). Sitä vastoin kaksipuolinen testi vertaa nollahypoteeseja vaihtoehtoon, jonka mukaan p1
ei ole yhtä suuri kuin p2
.
Pöydässäsi miesten laihduttajien osuus on 1/4 = 0,25 (10/40) näytteessäsi. Toisaalta ei-laihduttavien miesten osuus on 1/13 tai (5 65: stä) yhtä suuri kuin 0,077 näytteessä. Joten estimaatti p1
on 0,25 ja p2
on 0,077. Siksi näyttää siltä, että p1>p2
.
Siksi yksipuoliselle vaihtoehdolle p1>p2
p-arvo on 0,01588. (Pienet p-arvot osoittavat, että nollahypoteesi on epätodennäköinen ja vaihtoehto on todennäköinen.)
Kun vaihtoehto on p1<p2
, näemme, että tietosi osoittivat, että ero on väärään (tai odottamattomaan) suuntaan.
Siksi siinä tapauksessa p-arvo on niin korkea 0,9967. Kaksipuolisessa vaihtoehdossa p-arvon tulisi olla hieman suurempi kuin yksipuolisella vaihtoehdolla p1>p2
. Ja todellakin, sen p-arvo on 0,02063.
Kommentit
- Fantastinen selitys. Joten, kalastajan tarkka testi vertaa tosiasiallisesti todennäköisyyttä rivien välillä sarakkeiden sijaan?
- @Christian: Ei, sillä ei ole ' väliä onko rivillä vai sarakkeilla kalastajan testi tarkistaa korrelaation varautumistaulukossa. Riveillä ja sarakkeilla ei ole välitöntä merkitystä '. Voit myös muotoilla hypoteesin uudelleen: sen sijaan, että H0 on " tupakoitsija, kuolee nuorempi ", oletat myös, että H0: " nuoremmiksi kuolevat ihmiset tupakoivat todennäköisemmin ". Fisher-testin tulokset kertovat sinulle, tukeeko havaittu yhteys tiedoissa nolla-hypoteesia vai ei, mutta sillä ei ole merkitystä, mikä on riippumaton vai riippuvainen muuttuja ja yhtä lailla rivien / sarakkeiden valinnalla ei ole merkitystä ' ei ole väliä 🙂