다음 데이터 세트가 있다고 가정합니다.
Men Women Dieting 10 30 Non-dieting 5 60
If R에서 Fisher 정확한 테스트를 실행하면 alternative = greater
(또는 그 이하)가 의미하는 바는 무엇입니까? 예 :
mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")
p-value = 0.01588
및 odds ratio = 3.943534
를 얻습니다. . 또한 다음과 같이 분할 표의 행을 뒤집을 때 :
mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")
그런 다음 p-value = 0.9967
및 odds ratio = 0.2535796
. 그러나 대체 인수 (예 : fisher.test(mat)
)없이 두 개의 분할 표를 실행하면 p-value = 0.02063
가 표시됩니다.
- 이유를 설명해 주시겠습니까?
- 또한 위의 경우 귀무 가설과 대립 가설은 무엇입니까?
-
다음과 같은 분할 테이블에서 fisher 테스트를 실행할 수 있습니까?
mat = matrix(c(5000,10000,69999,39999), 2, 2)
PS : 저는 통계학자가 아닙니다. 당신의 도움 (간단한 영어 답변)을 높이 평가할 수 있도록 통계를 배우려고 노력하고 있습니다.
답변
greater
(또는 less
)는 p1=p2
를 대체 p1>p2
(또는 ). 반대로 양측 검정은 귀무 가설을 p1
가 p2
와 같지 않다는 대안과 비교합니다.
표에서 남성 인 다이어트하는 사람의 비율은 표본에서 1/4 = 0.25 (40 명 중 10 명)입니다. 반면 남성 인 비식이자의 비율은 1/13 또는 (65 명 중 5 명) 샘플에서 0.077과 같습니다. 따라서 p1
의 추정치는 0.25이고 p2
의 추정치는 0.077입니다. 따라서 p1>p2
인 것으로 보입니다.
이것이 일방적 대안 p1>p2
의 p- 값이 0.01588. (작은 p- 값은 귀무 가설이있을 가능성이 낮고 대안이있을 가능성이 있음을 나타냅니다.)
대안이 p1<p2
인 경우 귀하의 데이터가 차이가 있음을 나타냅니다. 잘못된 (또는 예상치 못한) 방향입니다.
이 경우 p- 값이 0.9967이 너무 높습니다. 양면 대안의 경우 p- 값은 단측 대안 p1>p2
보다 약간 높아야합니다. 실제로 p- 값은 0.02063입니다.
댓글
- 환상적인 설명입니다. 따라서 fisher 정확한 테스트는 실제로 열이 아닌 행 간의 확률을 비교합니까?
- @Christian : 아니요, 행이든 열이든 상관없이 ' fisher 테스트는 분할 표에서 상관 관계를 확인합니다. 행과 열은 ' 직접적으로 중요하지 않습니다. 가설을 재구성 할 수도 있습니다. 대신 H0은 " 흡연하는 사람이 더 젊게 사망하는 " H0을 가정 할 수도 있습니다. " 어릴 때 사망하는 사람들은 담배를 피울 가능성이 더 높습니다 ". fisher 테스트의 결과는 데이터에서 관찰 된 연결이 귀무 가설을 지원하는지 여부를 알려줍니다. 그러나 ' 어떤 것이 독립 변수인지 종속 변수인지 그리고 동등하게 중요하지 않습니다. 행 / 열 선택이 ' 중요하지 않습니다. 🙂