Załóżmy, że mamy następujący zestaw danych:
Men Women Dieting 10 30 Non-dieting 5 60
Jeśli Uruchamiam dokładny test Fishera w R i co oznacza alternative = greater
(lub mniej)? Na przykład:
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
Otrzymuję p-value = 0.01588
i odds ratio = 3.943534
. Ponadto, kiedy odwracam wiersze tabeli kontyngentów w następujący sposób:
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
wtedy otrzymuję p-value = 0.9967
i odds ratio = 0.2535796
. Ale kiedy uruchamiam dwie tabele awaryjne bez alternatywnego argumentu (tj. fisher.test(mat)
), otrzymuję p-value = 0.02063
.
- Czy mógłbyś wyjaśnić mi powód?
- Ponadto, jaka jest hipoteza zerowa i hipoteza alternatywna w powyższych przypadkach?
-
Czy mogę przeprowadzić test Fishera na takiej tabeli kontyngencji:
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS: Nie jestem statystykiem. Próbuję nauczyć się statystyki, więc Twoja pomoc (odpowiedzi w prostym języku angielskim) byłaby bardzo mile widziana.
Odpowiedź
greater
(lub less
) odnosi się do jednostronnego testu porównującego hipotezę zerową, że p1=p2
z alternatywnym p1>p2
(lub p1<p2
). Natomiast test dwustronny porównuje hipotezy zerowe z alternatywą, że p1
nie jest równe p2
.
Dla twojego stołu proporcja mężczyzn na diecie to 1/4 = 0,25 (10 z 40) w twojej próbce. Z drugiej strony, odsetek mężczyzn, którzy nie stosują diety, wynosi 1/13 lub (5 z 65) równy 0,077 w próbce. Zatem oszacowanie dla p1
wynosi 0,25, a dla p2
wynosi 0,077. Dlatego wydaje się, że p1>p2
.
Dlatego dla jednostronnej alternatywy p1>p2
wartość p jest 0,01588. (Małe wartości p wskazują, że hipoteza zerowa jest mało prawdopodobna, a alternatywa jest prawdopodobna).
Gdy alternatywą jest p1<p2
, widzimy, że Twoje dane wskazują, że różnica jest w złym (lub nieoczekiwanym) kierunku.
Dlatego w tym przypadku wartość p jest tak wysoka 0,9967. W przypadku wariantu dwustronnego wartość p powinna być nieco wyższa niż w przypadku wariantu jednostronnego p1>p2
. I rzeczywiście, ma wartość p równą 0,02063.
Komentarze
- Fantastyczne wyjaśnienie. Czyli dokładny test Fishera faktycznie porównuje prawdopodobieństwa między wierszami w przeciwieństwie do kolumn?
- @Christian: Nie, nie ' nie ma znaczenia, czy jego wiersze czy kolumny są test rybaka sprawdza korelację w tabeli kontyngentów. Wiersze i kolumny nie ' nie mają bezpośredniego znaczenia. Możesz też po prostu przeformułować hipotezę: zamiast H0 to " ludzie, którzy palą, umierają młodsi ", możesz również przyjąć H0: " osoby umierające młodo częściej palą ". Wyniki testu Fishera powie Ci, czy jakiekolwiek obserwowane powiązanie w danych potwierdza hipotezę zerową, czy nie, ale nie ' t ma znaczenie, która jest zmienną niezależną lub zależną i równie wybór wierszy / kolumn nie ' nie ma znaczenia 🙂