저는 Fisher의 결합 테스트를 사용하여 여러 가지 독립 테스트를 통합하고 있습니다. 어떤 경우에는 결과를 이해하는 데 문제가 있습니다.

예 : mu가 0보다 작다는 가설을 가지고 두 가지 다른 테스트를 실행했다고 가정 해 보겠습니다. n이 동일하고 두 샘플의 계산 된 분산이 동일하지만 한 테스트에서 평균이 $ 1.5 $이고 다른 테스트가 $ -1.5 $라고 가정 해 보겠습니다. 두 개의 보완 p-val (예 : $ 0.995 $ & $ 0.005 $)을 받게됩니다. 흥미롭게도 두 가지를 결합하면 Fisher 테스트에서 상당한 $ p $-값이 나타납니다 : $ p = 0.0175 $.

정확히 반대되는 테스트를 선택할 수 있었기 때문에 $ (\ mu > 0) $ 및 샘플 결과-여전히 $ p = 0.0175 $를받습니다. 마치 Fisher 테스트가 가설의 방향을 고려하지 않는 것처럼 보입니다.

누구든지 이것을 설명 할 수 있습니까?

감사합니다

댓글

h3>

  • 이 질문을 올바르게 해석하면 Rice의 토론, A Consensus Combined P-Value Test and the Family -wide Significance of Component Tests (Biometrics 1990)는이 문제를 설명합니다. 304 페이지 참조.이 문서는 해결책을 제공합니다.
  • 실제로 Fisher 사용 '의 결합 확률 테스트 0.995와 0.005의 결합 p는 0.03입니다. 해석이 바뀌는 것은 아니지만 (웃음) 0.0175가 어디에서 왔는지 궁금합니다.
  • @AussieAndy 예, 나 동의 함-약 0.03136

Answer

Fisher 조합 테스트는 별도의 정보를 결합하기위한 것입니다. 개별 테스트의 검정력이 충분하지 않을 때 검정력을 얻기 위해 독립적 인 데이터 세트에서 수행되는 검정. dea는 $ k $ 귀무 가설이 모두 올 바르면 $ p $ -값이 균일하다는 것입니다. 서로 독립적으로 $ [0,1] $ 에 배포됩니다. 이는 $-2 ∑ \ log (p_i) $ $ \ chi ^ 2 $ 가됨을 의미합니다. 자유도 $ 2k $ . 이 결합 된 귀무 가설을 거부하면 귀무 가설 중 하나 이상이 거짓이라는 결론을 내릴 수 있습니다. 이것이 바로이 절차를 적용 할 때 수행하는 작업입니다.

댓글

  • 이것은 질문에 의해 제기 된 실제 문제를 해결하지 않는 것 같습니다. 두 p- 값은 대칭 적으로 반대 이므로 (적어도 직관에 따르면) " 취소, " Fisher '의 방법이 " 중요한 "를 생성하는 방법은 무엇입니까? 결과-그리고 어떤 결론을 뒷받침합니까 ??
  • $ 2k $ df.
  • +1 for 이 결합 된 귀무 가설을 거부하면 다음과 같은 결론이 도출됩니다. 귀무 가설 중 적어도 하나는 거짓입니다.
  • @whuber의 당시 OP &는 의견은 결합 된 귀무 가설의 거부의 의미를 오해하고 있습니다. eric_kernfield는 내 대답에서 내가 말한 것을 반복함으로써 이것을 강조하고 있습니다.
  • @Michael, 나는 결합 된 가설을 거부하는 것이 의미하는 것만 큼 초보적인 것을 오해 한 것 같지 않습니다. 귀하의 답변에서 누락 된 것은 OP와 내 의견에 의해 제기 된 명백한 역설에 대한 설명 입니다. 설명을 구할 수있는 한 곳은 한 경우 데이터가 null과 일치하고 다른 경우에는 눈에 띄게 일관성이 없다는 것입니다. 따라서 결합 된 데이터 세트는 여전히 null과 약간의 불일치를 나타내므로 Fisher p- 값이 낮지 만 그렇게 낮지는 않습니다. 이것은 욕설을 던지기보다는 생각과 연구가 필요합니다.

답변

$ p $를 결합하는 방법에는 여러 가지가 있습니다. -values와 그들 중 일부는이 속성을 가지고 있고 일부는 그렇지 않습니다. 이는 부분적으로 문제가 잘 지정되지 않았기 때문입니다. 가장 잘 알려진 많은 방법에 대한 광범위한 시뮬레이션 연구 가있었습니다. 결론은 취소 속성을 원할 경우 가질 수 있지만 반드시 그럴 필요는 없다는 것입니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다