Předpokládejme, že máme následující soubor dat:
Men Women Dieting 10 30 Non-dieting 5 60
If Spustím Fisherův přesný test v R, co tedy alternative = greater
(nebo méně) znamená? Například:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Zobrazují se mi p-value = 0.01588
a odds ratio = 3.943534
. Když také otočím řádky kontingenční tabulky takto:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
, zobrazí se mi p-value = 0.9967
a odds ratio = 0.2535796
. Ale když spustím dvě kontingenční tabulky bez alternativního argumentu (tj. fisher.test(mat)
), dostanu p-value = 0.02063
.
- Můžete mi prosím vysvětlit důvod?
- Jaká je také nulová hypotéza a alternativní hypotéza ve výše uvedených případech?
-
Mohu spustit test Fisher na kontingenční tabulce, jako je tento:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: Nejsem statistik. Snažím se naučit statistiky, takže vaše pomoc (odpovědi v jednoduché angličtině) by byla velmi oceněna.
Odpověď
greater
(nebo less
) odkazuje na jednostranný test porovnávající nulovou hypotézu, že p1=p2
s alternativou p1>p2
(nebo p1<p2
). Naproti tomu dvoustranný test porovnává nulové hypotézy s alternativou, že p1
se nerovná p2
.
Pro váš stůl je podíl dieters, kteří jsou muži, 1/4 = 0,25 (10 ze 40) ve vašem vzorku. Na druhé straně je podíl mužů, kteří nemají dietu, 1/13 nebo (5 ze 65), což je 0,077 ve vzorku. Takže odhad pro p1
je 0,25 a pro p2
je 0,077. Proto se zdá, že p1>p2
.
Proto je pro jednostrannou alternativu p1>p2
hodnota p 0,01588. (Malé hodnoty p naznačují, že nulová hypotéza je nepravděpodobná a alternativa je pravděpodobná.)
Když je alternativou p1<p2
vidíme, že vaše data naznačují, že rozdíl je ve špatném (nebo neočekávaném) směru.
Proto je v takovém případě p-hodnota tak vysoká 0,9967. U oboustranné alternativy by měla být hodnota p o něco vyšší než u jednostranné alternativy p1>p2
. A skutečně má hodnotu p rovnou 0,02063.
Komentáře
- Fantastické vysvětlení. Test přesného rybáře tedy ve skutečnosti porovnává pravděpodobnosti mezi řádky na rozdíl od sloupců?
- @Christian: Ne, nezáleží na tom, ' zda jeho řádky nebo sloupce jsou test rybáře kontroluje korelaci v kontingenční tabulce. Na řádcích a sloupcích nezáleží ' přímo. Dalo by se také přeformulovat hypotézu: místo toho H0 jsou " lidé, kteří kouří umírají mladší ", můžete také předpokládat H0: " lidé, kteří zemřou mladší, častěji kouří ". Výsledky rybářského testu vám řeknou, zda jakékoli pozorované spojení v datech podporuje nulovou hypotézu, či nikoli, ale nezáleží na tom,
co je nezávislá nebo závislá proměnná a stejně na výběru řádků / sloupců nezáleží ' na tom 🙂