P를 결합하기 위해 Fisher의 방법을 사용하고 있습니다. -values, 큰 p- 값 및 큰 $ n에 대해 이상한 동작을 발견했습니다. $
제 경우에는 통계적으로 유의하지 않은 결과 (예 : .1 ~ .5)가 많이 있습니다. 나는 그것들을 결합하기 위해 Fisher의 방법을 사용하고있다. 그러나 Fisher의 방법이 이러한 큰 p- 값에 대해 불안정한 동작을 표시하는 것으로 나타났습니다. 따라서 p- 값을 .367에서 .368로 변경하면 결합 된 p- 값이 크게 변경됩니다. 그 이유는 무엇입니까?
p_value=fisherIntegration(rep(.367,10000000) #p_value=1.965095e-14 p_value=fisherIntegration(rep(.368,10000000) #pvalue=0.8499356
반대로 낮은 p- 값과 작은 $ n, $의 경우 이것은 매우 잘 작동했습니다. 예 :
p_value=fisherIntegration(rep(.05,10)) #pvalue=7.341634e-06
피셔 통합에 사용하는 기능은 다음과 같습니다.
fisherIntegration <- function (vector){ my_length=length(vector) deg_free=my_length*2 y=-2*sum(log(vector)) p.val <- 1-pchisq(y, df = deg_free); p.val=as.numeric(p.val); return(p.val)
}
편집이 게시물은 다소 관련이 있지만이 컨텍스트에서 .367이 매직 넘버 인 이유는 다루지 않습니다. Fisher '의 메서드가 $ p \를 산출하는 이유 $ 0.5 $와 같은 여러 p- 값을 결합 할 때 gg 0.5 $?
댓글
- $ 0.367 \ lt e ^ {-1} \ lt 0.368 $? (이 방식으로 $ 10 ^ 7 $ p- 값을 결합한다고 주장하는 운동의 유일한 요점입니다. 통계적 용도가 없습니다.)
- I '이 사실을 인식하지 못했습니다. 저는 '이게 이상한 동작과 관련이 있다고 확신하지만 그 이유를 잘 모르겠습니다.
- 다른 방향에서는 무엇을 ' 카이 제곱 분포의 평균입니까?
- 이 Q & 특히 Christoph Hanck '의 답변 stats.stackexchange.com/questions/243003/ …
답변
피셔의 방법은 연속 테스트 통계가있는 귀무 가설 하에서 독립적으로 발생한다는 가정하에 p- 값 $ p_1, p_2, \ ldots, p_n $을 결합합니다. 즉, 각각은 $ 0 $와 $ 1. $ 사이에 균등하게 분배 됨 $ -2 \ log (p_i) $에 $ \ chi ^ 2 (2) $ 분배가 있음을 간단히 계산할 수 있습니다.
$$ P = \ sum_ {i = 1} ^ n -2 \ log (p_i) $$
에는 $ \ chi ^ 2 (2n) $ 분포가 있습니다. 큰 $ n $ (중앙 한계 정리에 의해 보장됨)의 경우이 분포는 대략 정상입니다. 우리가 쉽게 계산할 수 있듯이 평균은 $ 2n $이고 분산은 $ 4n, $입니다.
이제 $ P $가이 평균과 “훨씬”다르다고 가정합니다. “다량”은 표준 편차와 비교하여 평소와 같이 의미합니다. 즉, $ P $가 $ 2n $와 $ \ sqrt {4n} = 2 \ sqrt {n}. $의 몇 배 이상 차이가 났다고 가정합니다. 정규 분포에 대한 기본 정보에서 이것은 $ P $가 다음 중 하나임을 의미합니다. 비정상적으로 작거나 비정상적으로 큽니다. 결과적으로 $ P $가 $ 2n-2K \ sqrt {n} $에서 $ 2n + 2K \ sqrt {n} $의 범위이므로 $ K \ approx 3, $ Fisher “s 방법은 누적 확률을 할당합니다 (즉, p-value) 범위는 거의 $ 0 $에서 거의 $ 1. $까지입니다.
즉, $ P $에 대한 모든 “흥미로운”확률은 작은 $ K $에 대한 간격 $ (2n-2K \ sqrt {n}, 2n + 2K \ sqrt {n}) $. $ n $가 증가함에 따라이 간격은 좁아집니다. 중심 ($ 2n $)에 상대적입니다.
이 결과에서 얻을 수있는 한 가지 결론은 $ \ sqrt {n} $가 $ 2K $를 지배 할만큼 충분히 클 때입니다. $ n $이 $ (2 \ times3) ^ 2 \ approx 40 $ 정도보다 훨씬 크면 Fisher s Method가 유용성 한계에 도달 할 수 있습니다.
상황에서 질문 $ n = 10 ^ 7. $ 평균 로그 p- 값 $ -P / (2n), $에 대한 흥미로운 간격은 대략
$$입니다. -(2n-2K \ sqrt {n}, 2n + 2K \ sqrt {n}) / (2n) \ approx (-0.999051, -1.00095) $$
$ K = 3. $
해당 g eometric 평균 p- 값 은
$$ e ^ {-0.999051} = 0.368229 \ text {and} e ^ {-1.00095} = 0.367531. $$
입니다. 질문에 사용 된 $ 0.367 $의 더 낮은 값은이 구간을 벗어나서 본질적으로 0 (더 낮은) 꼬리 확률을 제공하는 반면, $ 0.368 $의 상위 값은이 구간 내에 있으므로 여전히 $ 1보다 현저하게 낮은 확률을 제공합니다. 다음과 같이 다시 설명 할 수있는 이전 결론의 극단적 인 예 :
p- 값의 평균 자연 로그가 $ -1과 크게 다를 때 , $ Fisher의 방법은 $ 0 $에 매우 가깝거나 $ 1 $에 가까운 결합 된 p- 값을 생성합니다. “Much”는 $ 1 / \ sqrt {2n}에 비례합니다. $
댓글
- 이 답변을 바탕으로 큰 n의 경우 stouffer 통합이 더 적절하다고 주장 하시겠습니까?
- 많은 수의 p- 값을 결합 할 때 엄청난 양의 정보가 폐기되고 $ n $가 큰 결과가 독립성 가정에 민감하기 때문에 (실제로 거의 유지되지 않음) , 아니요 이들을 단일 결정으로 결합하는 방법은 대부분의 상황에서 적합합니다. Stouffer '의 방법은 Fisher '의 방법과 거의 다릅니다.
- 나는 ' 동의하지 않습니다. 적어도 Stouffer 통합은이 이상한 " 임계 값 " 동작을 표시하지 않습니다. 내가 말할 수있는 한, zscores의 벡터를 0보다 지속적으로 전달하면 (예 : .5와 같은 1000 zscore) 항상 원본보다 최종 zscore가 생성되며 이는 논리적입니다. 여기 Fisher '의 방법은 ' 버그 '
- 차이가 무엇이든간에 방법은 수백만 개의 p- 값을 결합하기위한 것이거나 유용하지 않습니다. 유용한 응용 분야에서 그들은 크게 다르지 않는 경향이 있습니다. Fisher ' " 버그 "가 없습니다 '의 접근 방식 : 가정과 목표를 고려할 때 ' 완벽하게 정확합니다. Stouffer ' s는 약간의 임시 이며 추가 가정에 암시 적으로 의존합니다. 더 건설적으로 말하면, 많은 (독립적 인) p- 값이있을 때 단일 결합 통계에서보다 분포가 균일 성에서 어떻게 벗어나는지 연구함으로써 더 많은 정보를 얻을 수 있습니다.
- 확인. 나는 Fisher '의 방법에 대해 ' 정말 동의하지 않습니다. 구체적인 예와 유사하게 " fisherIntegration (rep (.367,1000)) =. 4999 "에 대해 논의했지만 " fisherIntegration (rep (.367,10000000)) = 1.965095e-14 "는 직관적으로 어리 석습니다. 모든 방법은 가정 / 목적을 고려할 때 정당화 될 수 있지만이 경우 이러한 종류의 임계 값 종속 동작은 대부분의 사용자가 합리적이라고 생각하는 것과 맞지 않습니다. 물론, 단일 요약 통계가 분포를 자세히 조사하는 것보다 나쁠 것이라는 데 동의합니다.
입니다.