Předpokládejme, že máme následující soubor dat:

 Men Women Dieting 10 30 Non-dieting 5 60 

If Spustím Fisherův přesný test v R, co tedy alternative = greater (nebo méně) znamená? Například:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Zobrazují se mi p-value = 0.01588 a odds ratio = 3.943534 . Když také otočím řádky kontingenční tabulky takto:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

, zobrazí se mi p-value = 0.9967 a odds ratio = 0.2535796. Ale když spustím dvě kontingenční tabulky bez alternativního argumentu (tj. fisher.test(mat)), dostanu p-value = 0.02063.

  1. Můžete mi prosím vysvětlit důvod?
  2. Jaká je také nulová hypotéza a alternativní hypotéza ve výše uvedených případech?
  3. Mohu spustit test Fisher na kontingenční tabulce, jako je tento:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Nejsem statistik. Snažím se naučit statistiky, takže vaše pomoc (odpovědi v jednoduché angličtině) by byla velmi oceněna.

Odpověď

greater (nebo less) odkazuje na jednostranný test porovnávající nulovou hypotézu, že p1=p2 s alternativou p1>p2 (nebo p1<p2). Naproti tomu dvoustranný test porovnává nulové hypotézy s alternativou, že p1 se nerovná p2.

Pro váš stůl je podíl dieters, kteří jsou muži, 1/4 = 0,25 (10 ze 40) ve vašem vzorku. Na druhé straně je podíl mužů, kteří nemají dietu, 1/13 nebo (5 ze 65), což je 0,077 ve vzorku. Takže odhad pro p1 je 0,25 a pro p2 je 0,077. Proto se zdá, že p1>p2.

Proto je pro jednostrannou alternativu p1>p2 hodnota p 0,01588. (Malé hodnoty p naznačují, že nulová hypotéza je nepravděpodobná a alternativa je pravděpodobná.)

Když je alternativou p1<p2 vidíme, že vaše data naznačují, že rozdíl je ve špatném (nebo neočekávaném) směru.

Proto je v takovém případě p-hodnota tak vysoká 0,9967. U oboustranné alternativy by měla být hodnota p o něco vyšší než u jednostranné alternativy p1>p2. A skutečně má hodnotu p rovnou 0,02063.

Komentáře

  • Fantastické vysvětlení. Test přesného rybáře tedy ve skutečnosti porovnává pravděpodobnosti mezi řádky na rozdíl od sloupců?
  • @Christian: Ne, nezáleží na tom, ' zda jeho řádky nebo sloupce jsou test rybáře kontroluje korelaci v kontingenční tabulce. Na řádcích a sloupcích nezáleží ' přímo. Dalo by se také přeformulovat hypotézu: místo toho H0 jsou " lidé, kteří kouří umírají mladší ", můžete také předpokládat H0: " lidé, kteří zemřou mladší, častěji kouří ". Výsledky rybářského testu vám řeknou, zda jakékoli pozorované spojení v datech podporuje nulovou hypotézu, či nikoli, ale nezáleží na tom,

co je nezávislá nebo závislá proměnná a stejně na výběru řádků / sloupců nezáleží ' na tom 🙂

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *