Załóżmy, że mamy następujący zestaw danych:

 Men Women Dieting 10 30 Non-dieting 5 60 

Jeśli Uruchamiam dokładny test Fishera w R i co oznacza alternative = greater (lub mniej)? Na przykład:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Otrzymuję p-value = 0.01588 i odds ratio = 3.943534 . Ponadto, kiedy odwracam wiersze tabeli kontyngentów w następujący sposób:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

wtedy otrzymuję p-value = 0.9967 i odds ratio = 0.2535796. Ale kiedy uruchamiam dwie tabele awaryjne bez alternatywnego argumentu (tj. fisher.test(mat)), otrzymuję p-value = 0.02063.

  1. Czy mógłbyś wyjaśnić mi powód?
  2. Ponadto, jaka jest hipoteza zerowa i hipoteza alternatywna w powyższych przypadkach?
  3. Czy mogę przeprowadzić test Fishera na takiej tabeli kontyngencji:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Nie jestem statystykiem. Próbuję nauczyć się statystyki, więc Twoja pomoc (odpowiedzi w prostym języku angielskim) byłaby bardzo mile widziana.

Odpowiedź

greater (lub less) odnosi się do jednostronnego testu porównującego hipotezę zerową, że p1=p2 z alternatywnym p1>p2 (lub p1<p2). Natomiast test dwustronny porównuje hipotezy zerowe z alternatywą, że p1 nie jest równe p2.

Dla twojego stołu proporcja mężczyzn na diecie to 1/4 = 0,25 (10 z 40) w twojej próbce. Z drugiej strony, odsetek mężczyzn, którzy nie stosują diety, wynosi 1/13 lub (5 z 65) równy 0,077 w próbce. Zatem oszacowanie dla p1 wynosi 0,25, a dla p2 wynosi 0,077. Dlatego wydaje się, że p1>p2.

Dlatego dla jednostronnej alternatywy p1>p2 wartość p jest 0,01588. (Małe wartości p wskazują, że hipoteza zerowa jest mało prawdopodobna, a alternatywa jest prawdopodobna).

Gdy alternatywą jest p1<p2, widzimy, że Twoje dane wskazują, że różnica jest w złym (lub nieoczekiwanym) kierunku.

Dlatego w tym przypadku wartość p jest tak wysoka 0,9967. W przypadku wariantu dwustronnego wartość p powinna być nieco wyższa niż w przypadku wariantu jednostronnego p1>p2. I rzeczywiście, ma wartość p równą 0,02063.

Komentarze

  • Fantastyczne wyjaśnienie. Czyli dokładny test Fishera faktycznie porównuje prawdopodobieństwa między wierszami w przeciwieństwie do kolumn?
  • @Christian: Nie, nie ' nie ma znaczenia, czy jego wiersze czy kolumny są test rybaka sprawdza korelację w tabeli kontyngentów. Wiersze i kolumny nie ' nie mają bezpośredniego znaczenia. Możesz też po prostu przeformułować hipotezę: zamiast H0 to " ludzie, którzy palą, umierają młodsi ", możesz również przyjąć H0: " osoby umierające młodo częściej palą ". Wyniki testu Fishera powie Ci, czy jakiekolwiek obserwowane powiązanie w danych potwierdza hipotezę zerową, czy nie, ale nie ' t ma znaczenie, która jest zmienną niezależną lub zależną i równie wybór wierszy / kolumn nie ' nie ma znaczenia 🙂

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *