Wikipedia :

“통계에서 가족 별 오류율 (FWER)은 확률입니다. 여러 가설 테스트를 수행 할 때 모든 가설 중에서 하나 이상의 잘못된 발견 또는 유형 I 오류를 만드는 것입니다. “

“FDR (false discovery rate)은 유형 I 오류 비율을 개념화하는 한 가지 방법입니다. 다중 비교를 수행 할 때 귀무 가설 테스트에서. “

이 두 개념의 차이점을 이해하지 못합니다. 두 개념이 동일하지 않은 이유는 무엇입니까?

다음 예를 더 자세히 설명합니다.

편향되지 않은 동전이 1,000 회 연속해서 50/50 헤드 / 테일 분포에서 실질적으로 벗어날 확률이 0.001이라고 말합니다.

If 동전 한 개가 편향되어 있는지 알아보고 싶습니다. 1,000 번 던지고, 앞면이 500 번 정도 나오면 편향되지 않은 것이 확실합니다.

하지만 100 만 개의 동전을 1,000 번 던지면 그 편견을 생각하다 앞면과 뒷면의 50/50 분포를 보여주지 않는 sed, 나는 편향되지 않은 동전을 편향된 것으로 분류 할 것입니다. 이는 편향되지 않은 동전이 50/50 분포에서 벗어나는 확률이 곱하기 때문입니다. 동전의 수 (100 만)로.

따라서 편향되지 않은 백만 개의 동전 세트에서 약 1,000,000 * 0.001 = 1,000 개의 동전이 50 % 꼬리, 50 % 앞면 분포에서 크게 벗어날 것으로 예상해야합니다.

내가 이해하는 한 이것은 여러 가설 테스트 (동의어 : 다중 비교?)입니다. 가설 “동전은 편향되지 않습니다”를 백만 번 테스트하고 있으며이 예에서 FDR 거짓 발견 률은 1,000입니다.

하지만 FWER (가족 별 오류율)은 무엇입니까?

댓글

답변

혼란스러운 이유 중 하나는 특별 광고를 고려하고 있기 때문일 수 있습니다. 모든 귀무 가설이 참인 경우 (예 : m = m0 ). 모든 귀무 가설이 참이면 FWER와 FDR은 실제로 동일합니다. m <의 경우 / em> 참 귀무 가설의 독립적 인 테스트, FDR = FWER = 1- (1- 알파) ^ m .

그 차이는 일부 귀무 가설이 참이고 일부는 null 일 때 발생합니다. 가설은 거짓입니다.이 경우 FDR은 Type I 오류가 될 중요한 테스트 ( 모든 테스트가 아님)의 예상 비율을 알려줍니다. 그런 다음 FDR을 계산합니다. 그것은 거짓 인 귀무 가설의 비율과 (거짓 귀무 가설의 검정에 대한 유의 확률)에 의존하기 때문에 간단하지 않습니다.

FWER와 FDR은 1보다 클 수 없습니다. 계산 한 1,000의 값은 제품군 별 오류율 (PFER = alpha * m)이라는 다른 오류율입니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다