Angenommen, wir haben den folgenden Datensatz:

 Men Women Dieting 10 30 Non-dieting 5 60 

If Ich führe den Fisher-Exact-Test in R aus. Was bedeutet dann alternative = greater (oder weniger)? Zum Beispiel:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

Ich erhalte die p-value = 0.01588 und odds ratio = 3.943534 . Wenn ich die Zeilen der Kontingenztabelle wie folgt umblättere:

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

, erhalte ich dann die p-value = 0.9967 und odds ratio = 0.2535796. Wenn ich jedoch die beiden Kontingenztabellen ohne das alternative Argument ausführe (d. H. fisher.test(mat)), erhalte ich die p-value = 0.02063.

  1. Könnten Sie mir bitte den Grund erklären?
  2. Was ist in den oben genannten Fällen die Nullhypothese und die Alternativhypothese?
  3. Kann ich den Fischertest für eine Kontingenztabelle wie die folgende durchführen:

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS: Ich bin kein Statistiker. Ich versuche Statistiken zu lernen, daher wäre Ihre Hilfe (Antworten in einfachem Englisch) sehr dankbar.

Antwort

greater (oder less) bezieht sich auf einen einseitigen Test, bei dem eine Nullhypothese verglichen wird, dass p1=p2 mit der Alternative p1>p2 (oder p1<p2). Im Gegensatz dazu vergleicht ein zweiseitiger Test die Nullhypothesen mit der Alternative, dass p1 nicht gleich p2 ist.

Für Ihre Tabelle beträgt der Anteil männlicher Diätetiker in Ihrer Stichprobe 1/4 = 0,25 (10 von 40). Andererseits beträgt der Anteil männlicher Nicht-Diätetiker 1/13 oder (5 von 65) 0,077 in der Stichprobe. Die Schätzung für p1 beträgt also 0,25 und für p2 0,077. Daher scheint p1>p2 zu sein.

Deshalb ist für die einseitige Alternative p1>p2 der p-Wert 0,01588. (Kleine p-Werte zeigen an, dass die Nullhypothese unwahrscheinlich und die Alternative wahrscheinlich ist.)

Wenn die Alternative p1<p2 ist, sehen wir, dass Ihre Daten den Unterschied anzeigen ist in der falschen (oder unerwarteten) Richtung.

Deshalb ist in diesem Fall der p-Wert so hoch 0,9967. Für die zweiseitige Alternative sollte der p-Wert etwas höher sein als für die einseitige Alternative p1>p2. Und tatsächlich ist es mit einem p-Wert von 0,02063.

Kommentare

  • Fantastische Erklärung. Der Fisher-Exact-Test vergleicht also tatsächlich die Wahrscheinlichkeiten zwischen Zeilen im Gegensatz zu Spalten?
  • @Christian: Nein, es spielt keine Rolle, ob seine Zeilen oder Spalten als sind. ' Der Fischertest prüft die Korrelation in einer Kontingenztabelle. Zeilen und Spalten spielen ' keine Rolle. Sie könnten auch einfach die Hypothese neu formulieren: Stattdessen könnte H0 als " Menschen, die rauchen, jünger sterben " Sie könnten auch H0: " Menschen, die jünger sterben, rauchen eher ". Die Ergebnisse des Fischertests würden Ihnen sagen, ob eine beobachtete Verbindung in den Daten die Nullhypothese unterstützt oder nicht, aber es spielt keine Rolle, welche die unabhängige oder abhängige Variable ist und welche gleich ist.

Die Auswahl der Zeilen / Spalten spielt keine Rolle, ' 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.