Oletetaan, että meillä on seuraava datajoukko:

 Men Women Dieting 10 30 Non-dieting 5 60 

Jos Suoritan Fisherin tarkan testin R: ssä, mitä sitten alternative = greater (tai vähemmän) tarkoittaa? Esimerkiksi:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Saan p-value = 0.01588 ja odds ratio = 3.943534 . Lisäksi kun käännän varautumistaulukon rivejä näin:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

saan p-value = 0.9967 ja odds ratio = 0.2535796. Mutta kun suoritan kaksi varautumataulukkoa ilman vaihtoehtoista argumenttia (ts. fisher.test(mat)), saan p-value = 0.02063.

  1. Voisitteko selittää syyn minulle?
  2. Mikä on myös nullhypoteesi ja vaihtoehtoinen hypoteesi edellä mainituissa tapauksissa?
  3. Voinko suorittaa kalastajakokeen tällaisella taulukkolla:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: En ole tilastotieteilijä. Yritän oppia tilastoja, jotta apuasi (vastaukset yksinkertaisella englanniksi) olisi erittäin arvostettua.

vastaus

greater (tai less) viittaa yksipuoliseen testiin, jossa verrataan nollahypoteesia p1=p2 vaihtoehtoiseen p1>p2 (tai p1<p2). Sitä vastoin kaksipuolinen testi vertaa nollahypoteeseja vaihtoehtoon, jonka mukaan p1 ei ole yhtä suuri kuin p2.

Pöydässäsi miesten laihduttajien osuus on 1/4 = 0,25 (10/40) näytteessäsi. Toisaalta ei-laihduttavien miesten osuus on 1/13 tai (5 65: stä) yhtä suuri kuin 0,077 näytteessä. Joten estimaatti p1 on 0,25 ja p2 on 0,077. Siksi näyttää siltä, että p1>p2.

Siksi yksipuoliselle vaihtoehdolle p1>p2 p-arvo on 0,01588. (Pienet p-arvot osoittavat, että nollahypoteesi on epätodennäköinen ja vaihtoehto on todennäköinen.)

Kun vaihtoehto on p1<p2, näemme, että tietosi osoittivat, että ero on väärään (tai odottamattomaan) suuntaan.

Siksi siinä tapauksessa p-arvo on niin korkea 0,9967. Kaksipuolisessa vaihtoehdossa p-arvon tulisi olla hieman suurempi kuin yksipuolisella vaihtoehdolla p1>p2. Ja todellakin, sen p-arvo on 0,02063.

Kommentit

  • Fantastinen selitys. Joten, kalastajan tarkka testi vertaa tosiasiallisesti todennäköisyyttä rivien välillä sarakkeiden sijaan?
  • @Christian: Ei, sillä ei ole ' väliä onko rivillä vai sarakkeilla kalastajan testi tarkistaa korrelaation varautumistaulukossa. Riveillä ja sarakkeilla ei ole välitöntä merkitystä '. Voit myös muotoilla hypoteesin uudelleen: sen sijaan, että H0 on " tupakoitsija, kuolee nuorempi ", oletat myös, että H0: " nuoremmiksi kuolevat ihmiset tupakoivat todennäköisemmin ". Fisher-testin tulokset kertovat sinulle, tukeeko havaittu yhteys tiedoissa nolla-hypoteesia vai ei, mutta sillä ei ole merkitystä, mikä on riippumaton vai riippuvainen muuttuja ja yhtä lailla rivien / sarakkeiden valinnalla ei ole merkitystä ' ei ole väliä 🙂

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *