次のデータセットがあるとします。

 Men Women Dieting 10 30 Non-dieting 5 60 

Ifフィッシャーの直接確率検定をRで実行すると、alternative = greater(またはそれ以下)は何を意味しますか?例:

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") 

p-value = 0.01588odds ratio = 3.943534を取得します。また、分割表の行を次のように反転すると、次のようになります。

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater") 

次に、p-value = 0.9967odds ratio = 0.2535796。しかし、代替引数なしで2つの分割表(つまり、fisher.test(mat))を実行すると、p-value = 0.02063が得られます。

  1. 理由を教えてください。
  2. また、上記の場合の帰無仮説と対立仮説は何ですか?
  3. 次のような分割表でフィッシャーの直接確率検定を実行できますか?

    mat = matrix(c(5000,10000,69999,39999), 2, 2) 

PS:私は統計学者ではありません。私は統計を学ぼうとしていますので、あなたの助け(簡単な英語での回答)をいただければ幸いです。

回答

greater(またはless)は、p1=p2というnull仮説を代替のp1>p2(または)。対照的に、両側検定では、帰無仮説をp1p2と等しくないという代替案と比較します。

あなたのテーブルでは、男性であるダイエットの割合は、サンプルでは1/4 = 0.25(40のうち10)です。一方、男性である非ダイターの割合は、サンプルでは1/13、つまり(65のうち5)0.077に相当します。したがって、p1の推定値は0.25であり、p2の推定値は0.077です。したがって、p1>p2のように見えます。

これが、一方的な代替のp1>p2のp値が0.01588。 (小さいp値は、帰無仮説がありそうになく、代替案がありそうなことを示します。)

代替案がp1<p2の場合、データが違いを示していることがわかります。は間違った(または予期しない)方向にあります。

そのため、その場合、p値は0.9967と非常に高くなります。両側の代替案の場合、p値は片側の代替案p1>p2の場合よりも少し高くする必要があります。そして確かに、それは0.02063に等しいp値を持っています。

コメント

  • 素晴らしい説明。したがって、フィッシャーの直接確率検定は、実際には列ではなく行間の確率を比較しますか?
  • @Christian:いいえ、'行と列のどちらがフィッシャーの直接確率検定は、分割表の相関関係をチェックします。行と列は直接関係ありません'。仮説を再定式化することもできます。代わりに、H0は"喫煙者が若くして死ぬ"であり、H0:"若くして亡くなる人は喫煙する可能性が高くなります"。フィッシャーの直接確率検定の結果は、データで観測された接続が帰無仮説をサポートするかどうかを示しますが、'独立変数と従属変数のどちらであるかは、等しく問題ではありません。行/列の選択は重要ではありません'重要です:)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です