フィッシャーの複合テストを使用して、いくつかの異なる独立したテストを融合しています。場合によっては結果を理解するのに問題があります。
例:muが0より小さいという仮説で、2つの異なるテストを実行するとします。nが同一であり、 2つのサンプルの計算された分散は同じです。ただし、一方のテストで平均が$ 1.5 $で、もう一方のテストで平均が$ -1.5 $であると仮定します。 2つの補完するp-valを取得します(例:$ 0.995 $ & $ 0.005 $)。興味深いことに、この2つを組み合わせると、フィッシャーの直接確率検定で有意な$ p $値が得られます:$ p = 0.0175 $。
正反対の検定$(\ mu > 0)$とサンプル結果-それでも$ p = 0.0175 $を取得します。フィッシャーの直接確率検定では仮説の方向性が考慮されていないかのようです。
誰かがこれを説明できますか?
ありがとう
コメント
- この質問を正しく解釈すると、ライスでの議論、 コンセンサス結合P値検定と家族コンポーネントテストの全体的な重要性 (Biometrics 1990)は、この問題を説明しています。304ページを参照してください。このペーパーは解決策を提供します。
- 実際にFisherを使用'の結合確率検定0.995と0.005の結合pは0.03です。解釈が変わるわけではありませんが(笑)、0.0175はどこから来たのか疑問に思います。
- @AussieAndyはい、私は同意する-私は約0.03136にします
回答
フィッシャーの直接確率検定は、別々の情報を組み合わせることが目的です。個々のテストに十分なパワーがない可能性がある場合にパワーを取得するために、独立したデータセットに対して実行されるテスト。 deaは、 $ k $ null仮説がすべて正しい場合、 $ p $ 値は一様になります。 $ [0,1] $ で互いに独立して配布されます。これは、 $ -2 ∑ \ log(p_i)$ が
コメント
- これは、質問によって提起された実際の問題に対処していないようです。 2つのp値は対称的に反対であるため、(少なくとも一部の直感によれば)"キャンセル、"フィッシャー'のメソッドが"重要な"を生成するのはどうしてですか結果-そしてそれはどの結論を支持しますか??
- それは$ 2k $ dfであるはずです。
- +1 for この結合されたヌル仮説を棄却すると、次の結論につながります帰無仮説の少なくとも1つが誤りです。
- 当時のOP &は@whuberのコメントは、結合されたヌル仮説の棄却の意味を誤解しています。 eric_kernfieldは、私の答えで私が言ったことを繰り返すことによってこれを強調しています。
- @Michael、私は、組み合わされた仮説を拒否することの意味と同じくらい基本的なことを誤解したのではないかと思います。あなたの答えに欠けているのは、OPと私のコメントによって提起された明らかなパラドックスの説明です。説明を求める可能性のある場所の1つは、データがnullと一致している場合と、著しく一貫していない場合があることに注意することです。そのため、結合されたデータセットはnullとの不一致を示します。これが、Fisherのp値が低い理由である可能性がありますが、それほど低くはありません。これは、攻撃を投げかけるのではなく、考えて研究する価値があります。
回答
$ p $を組み合わせる方法はいくつかあります。 -値とその一部にはこのプロパティがあり、一部にはありません。これは、問題が明確に特定されていないことが一因です。最もよく知られている方法の多くについて、広範なシミュレーション研究が行われています。要するに、キャンセルのプロパティが必要な場合は、それを取得できますが、取得する必要はありません。