몇 달부터 데이터 과학 통계를 공부하고 있습니다.
1) 여러 개를 비교해야 할 때 샘플 (> 2)이면 T 테스트가 지루하고 대신 ANOVA를 사용하여 “F 테스트”를 수행합니다.
2) 이상의 이해는 “F 테스트와 T 테스트 사이에 상호 배타적 인 요구 사항”을 만듭니다.
3) T 테스트도 배웠습니다 (be it : 1 sample / paired / 2 sample) 기본적으로 평균 차이를 테스트하는 반면 “F 테스트”는 분산 차이를 테스트합니다.
4) 이제 두 샘플 그룹이 평균은 거의 같지만 분산이 크게 다르다고 가정합니다. , 두 테스트 모두 다른 답을 줄까요?
T 테스트는 “그들은 다르지 않습니다”라고 말합니다. 그러나 “F 테스트”는 “다르다”라고 말할 것입니다.
또는 반대의 경우에도 마찬가지입니다. (매우 다른 평균이지만 거의 같은 분산) ..
5) 그래서 우리는 마침내 그들의 진정한 차이를 결정할 것입니까? (평균? 또는 분산?)
6) 그래서 질문은 : 그들은 어떻게 관련되어 있습니까? 원래 목표가 두 개 이상의 샘플이 서로 다르거 나 아님을 확인하는 것이 었으면, 샘플 그룹 수가 적을 때 “평균 찾기”(즉, T 테스트 선택)가 샘플 그룹이 없을 때 “분산 찾기”로 변경되는 방법 2 이상입니까? (사실이 : 분산과 평균이 기본적으로 표본 그룹의 독립적 인 특성 인 경우)
7) 두 표본이 실제로 다른지 아닌지를 찾기 위해이 두 측정 항목을 모두 확인해야합니까?
(내가 언급 한 요점에 일련 번호를 언급했습니다. 기본적으로 잘못 이해 한 것이 있으면 알려주세요. 각 요점에 대한 답변을 주면 감사하겠습니다)
댓글
- " 샘플 비교 "? 그들이 오는 인구의 평균이 같은지 다른지 비교하는 것에 대해 이야기하고 있습니까? 아니면 배포가 같은지 다른지 확인하는 것에 대해 이야기하고 있습니까?
- 잘 모르겠습니다 !! 그것이 내가 알고 싶은 것이기 때문에.! " 두 샘플 그룹이 모든 측면에서 서로 다른지 " 결정하기 위해 둘 다 찾아야하지 않습니까? 이보기를 강조 표시 한 자습서를 찾을 수 없습니다 .. 대부분의 자습서는 " …와 같이 설명합니다. 두 개 이상의 그룹을 비교하려면 F 테스트로 이동합니다. .. ". 그 때 시점이 " 평균보기에서 "에서 " 변이보기로 변경됩니다. !! " .. 따라서 나는 이것에 대해 명확하지 않습니다!
- stat의 새로운 학생으로서, 무엇을 찾아야할지 모르겠습니다! .. 대부분 튜토리얼 중 .. " T 테스트 OR F 테스트 " .. 어떤 튜토리얼도 " T와 F 모두 확인 !! (제 의견 : ' 두 각도에서 바라보아야하지 않습니까? (즉, 평균과 분산)?
- 아래 링크는 거기에 있습니다. 이미 참조했지만 내 질문에 대한 답변은 정확하지 않습니다.) : stats.stackexchange.com/questions/78150/ …
- " 테스트 "는 질문에 대한 답을 찾는 것입니다. 가장 먼저 알아야 할 것은 실제 질문이 무엇인지입니다!
답변
t-test 용어 검정 통계에 t- 분포 (귀무 가설 하에서)가있는 검정을 t- 검정이라고하고 검정 통계에 F- 분포가있는 검정을 F- 검정이라고하므로 F- 검정은 모호합니다. 두 개 이상의 사례가 있습니다.
두 표본의 분산을 비교하는 F- 검정이 있기 때문에 질문과 관련이 있지만 F는 아닙니다 . -표준 ANOVA 분석에 사용되는 테스트. 실제로 ANOVA F- 검정은 그룹 간 변동성과 그룹 내 변동성을 비교하고 그룹 간 변동성은 실제로 그룹 평균 간의 차이를 제곱하고 합산하여 측정하므로이 설정에서 t 검정과 F 검정은 모두 비교에 관한 것입니다. 그룹은 의미합니다. 실제로 두 그룹 / 요인 수준 만있는 경우 F- 검정 통계는 t- 검정 통계의 제곱이고 F- 검정은 양면 t- 검정과 동일합니다. 두 개 이상의 그룹에 대해 t- 검정의 문제는 t- 검정이 한 번에 두 그룹 만 비교할 수 있다는 것입니다. 즉, 여러 테스트 문제를 포함하여 모든 그룹을 비교하려면 여러 t- 검정이 필요합니다 (예 : 5 % 수준에서 여러 가설을 테스트하면 귀무 가설이 모두 참이라고 가정 할 때 하나 이상의 잘못된 유의성을 찾을 확률이 5 %보다 상당히 높을 수 있습니다.
또한 평균 간의 차이와 분산 간의 차이를 모두 탐구하는 데 관심이있을 수 있으며 동일한 평균을 가진 그룹은 여전히 다른 분산을 가질 수 있습니다. 이 두 가지 모두 여러 테스트를 포함하지만 실제로 둘 다 확인할 수 있습니다. 공짜 점심이 없습니다. ANOVA의 많은 응용에서 동일한 분산을 가정하는 것이 상당히 합리적이거나 평균 차이 만 상당한 관심을 갖기 때문에 (예 : 한 그룹이 다른 그룹보다 “더 나은”성능을 발휘하는지 여부 만 궁금함) 분산의 차이 명시 적으로 조사되지 않는 경우가 많습니다 ( “좋은”또는 “정확한”것인지에 대한 진술을 기권합니다. 또는 제 대답은 “에 따라 다릅니다”…).
댓글
- 설명해 주셔서 감사합니다.
답변
두 개 이상의 그룹을 비교하고 그 평균을 비교하는 데 관심이있는 경우 모든 그룹 평균이 같다는 가설을 테스트 할 때 ANOVA를 수행하는 것이 일반적입니다. 여러 $ t $ -tests는 각 테스트가 두 그룹의 평균이 동일한 경우에만 테스트하기 때문에 동등하지 않습니다. 요점 1)
$의 사용 C에 대한 F $ 테스트 ANOVA에서 비교하는 것은 그룹 평균과 그룹 내 분산 간의 분산이기 때문에 ompare 분산이 사용됩니다. (귀하의 요점 3)
나머지 질문은 답하기가 어렵습니다. 위의 요점을 참조하십시오. 무슨 일이 일어나고 있는지에 대해 오해가 있으신 것 같습니다.
답변
이 공식 고려
Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2
- 실용성 관점에서 이것은 사실 일 수 있습니다.
2. 대조군과 치료군이 같은 집단을 형성한다면 그들은 같을 것입니다. 그러나 남학생과 여학생이있는 경우, 위치 1과 위치 2는 다를 수 있습니다.
- 맞습니다.
- 가능합니다
- 당신의 목표에 따라. 그룹의 특성 (예 : 평균)이 다른지 알고 싶다면 t- 검정을 선택하십시오. 특정 적용 요인 (예 : 다양한 수준의 담배 니코틴)이 중요한 영향을 미치는지 알고 싶다면 F-test를 사용하세요.
-
포뮬러는 관련이 있지만 용도는 목표에 따라 다릅니다. .
-
아니요. t와 F 테스트가 해결하려는 목표 나 문제가 다르기 때문에 말이되지 않기 때문입니다.