R의 Fisher 테스트

다음 데이터 세트가 있다고 가정합니다.

 Men Women Dieting 10 30 Non-dieting 5 60

If R에서 Fisher 정확한 테스트를 실행하면 alternative = greater (또는 그 이하)가 의미하는 바는 무엇입니까? 예 :

mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater")

p-value = 0.01588 및 odds ratio = 3.943534를 얻습니다. . 또한 다음과 같이 분할 표의 행을 뒤집을 때 :

mat = matrix(c(5,10,60,30), 2, 2) fisher.test(mat, alternative="greater")

그런 다음 p-value = 0.9967 및 odds ratio = 0.2535796. 그러나 대체 인수 (예 : fisher.test(mat))없이 두 개의 분할 표를 실행하면 p-value = 0.02063가 표시됩니다.

이유를 설명해 주시겠습니까?
또한 위의 경우 귀무 가설과 대립 가설은 무엇입니까?
다음과 같은 분할 테이블에서 fisher 테스트를 실행할 수 있습니까?
```
mat = matrix(c(5000,10000,69999,39999), 2, 2) 
```

PS : 저는 통계학자가 아닙니다. 당신의 도움 (간단한 영어 답변)을 높이 평가할 수 있도록 통계를 배우려고 노력하고 있습니다.

답변

greater (또는 less)는 p1=p2를 대체 p1>p2 (또는 ). 반대로 양측 검정은 귀무 가설을 p1가 p2와 같지 않다는 대안과 비교합니다.

표에서 남성 인 다이어트하는 사람의 비율은 표본에서 1/4 = 0.25 (40 명 중 10 명)입니다. 반면 남성 인 비식이자의 비율은 1/13 또는 (65 명 중 5 명) 샘플에서 0.077과 같습니다. 따라서 p1의 추정치는 0.25이고 p2의 추정치는 0.077입니다. 따라서 p1>p2 인 것으로 보입니다.

이것이 일방적 대안 p1>p2의 p- 값이 0.01588. (작은 p- 값은 귀무 가설이있을 가능성이 낮고 대안이있을 가능성이 있음을 나타냅니다.)

대안이 p1<p2 인 경우 귀하의 데이터가 차이가 있음을 나타냅니다. 잘못된 (또는 예상치 못한) 방향입니다.

이 경우 p- 값이 0.9967이 너무 높습니다. 양면 대안의 경우 p- 값은 단측 대안 p1>p2보다 약간 높아야합니다. 실제로 p- 값은 0.02063입니다.

환상적인 설명입니다. 따라서 fisher 정확한 테스트는 실제로 열이 아닌 행 간의 확률을 비교합니까?
@Christian : 아니요, 행이든 열이든 상관없이 ' fisher 테스트는 분할 표에서 상관 관계를 확인합니다. 행과 열은 ' 직접적으로 중요하지 않습니다. 가설을 재구성 할 수도 있습니다. 대신 H0은 " 흡연하는 사람이 더 젊게 사망하는 " H0을 가정 할 수도 있습니다. " 어릴 때 사망하는 사람들은 담배를 피울 가능성이 더 높습니다 ". fisher 테스트의 결과는 데이터에서 관찰 된 연결이 귀무 가설을 지원하는지 여부를 알려줍니다. 그러나 ' 어떤 것이 독립 변수인지 종속 변수인지 그리고 동등하게 중요하지 않습니다. 행 / 열 선택이 ' 중요하지 않습니다. 🙂

답변

댓글

답글 남기기 답글 취소하기