F 테스트 및 t 테스트는 회귀 모델에서 수행됩니다.

R, 우리는 반응 변수의 적합치와 기대치를 얻습니다. 100 개의 데이터 포인트에 대해 설명 변수로 키가 있고 응답 변수로 체중이 있다고 가정합니다.

선형 모델의 각 변수 (다중 회귀 모델이있는 경우 설명 또는 독립 변수) 계수는 t- 값 (p 값과 함께)과 연관됩니까? 이 t- 값은 어떻게 계산됩니까?

또한 마지막에 하나의 F 테스트가 있습니다. 다시 계산에 대해 알고 싶습니다.

또한 선형 모델 이후의 ANOVA에서 F- 검정을 보았습니다.

나는 통계적 배경이 아닌 새로운 통계 학습자이지만 , 나는 이것에 대한 많은 튜토리얼을 겪었습니다. 내가 이미 그렇게 했으므로 기본 자습서로 나에게 갈 것을 제안하지 마십시오. 몇 가지 기본 예를 사용하여 T 및 F 테스트 계산에 대해 알고 싶습니다.

댓글

  • 무엇을 ' ' 예측 ' 변수입니까? 텍스트에서 실제로는 ' 응답 변수 '
  • 예! 반응 변수 또는 독립 변수. 나는 그것을 편집하고있다. 고마워요
  • 우와. 반응 변수 = 종속 변수 = y- 변수. 독립 변수 = 설명 변수 = 예측 변수 = x- 변수. 그것은 무엇입니까?
  • Glen_b에게 감사합니다. 회귀 모델에서 변수 유형을 배우는 것에 기쁩니다. Maaten buis가 아래에 제시 한 답변은 개념을 명확하게 해주었습니다.
  • @bioinformatician Here 도움이 될 수있는 용어 목록입니다. '는 " 종속 변수 " = 설명 된 변수 ", " 예측 및 ", " 회귀 및 ", " 응답 ", " 내인 ", " 결과 ", " 제어 변수 ". 다음은 " 설명 변수 " = " 독립 변수 ", " 예측 자 ", " 회귀 자 ", " 자극 ", " 외부 ", " 공변량 ", " 제어 변수 ". 이러한 용어 중 일부는 다양한 분야에서 다른 용어보다 더 많이 사용됩니다.

답변

오해가 첫 번째 전제입니다. “F 테스트와 $ t $-테스트는 두 모집단간에 수행됩니다.”이것은 올바르지 않거나 적어도 불완전합니다. 계수 옆에있는 $ t $ -test는 해당 계수가 0이라는 귀무 가설을 테스트합니다. 해당 변수가 이진 인 경우 (예 : 0 = 남성, 1 = 여성) 두 모집단을 설명하지만 합병증이 추가됩니다. 모델의 다른 공변량에 대해서도 조정합니다. 예를 들어, 그 변수가 연속적인 경우, 예를 들어 교육 기간이 0 년인 사람과 교육 경력이 1 년인 사람을 비교하고 1 년 교육을받은 사람과 2 년 교육을받은 사람 등을 비교할 수 있습니다. 각 단계가 예상 결과에 동일한 영향을 미치고 다시 모델의 다른 공변량에 대해 조정하는 복잡성을 갖는 제약.

선형 회귀 후 F- 검정은 상수를 제외한 모델의 모든 계수가 0이라는 귀무 가설을 테스트합니다. 따라서 비교하는 그룹은 훨씬 더 복잡합니다.

댓글

  • Maarten Buis 님! 좋은 설명입니다. 내가 작성한 찬성 투표 🙂 .. 현재 평판 점수로는 투표 할 수 없습니다. 🙁 !!

답변

처음에는 몇 가지 표기법, 저는 z ~ N (0,1), u ~ χ2 (p), v ~ χ2 (q) 및 z, u와 v를 사용하고 있습니다. 서로 독립적입니다 (중요한 조건).

  1. t = z / sqrt (u / p). 각 계수 βj에 대해 h0 : βj = 0인지 테스트하면, (βj-0) / 1은 기본적으로 z, 표본 분산 (n-2) S ^ 2 ~ χ2 (n-2), 그러면 하단 부분도 있습니다. 따라서 t가 크면 H0 (중요한 p- 값)에서 벗어남을 의미하고 Ho를 거부합니다. .
  2. F = (u / p) / (v / q), 여기서 u는 비 중심 매개 변수 λ를 가질 수 있습니다. 일반적인 선형 회귀에서 두 개의 독립적 인 χ2를 어떻게 얻습니까?예상 βhat (전체 벡터) 및 예상 표본 분산 s ^ 2 는 항상 독립적입니다. 따라서 선형 회귀의 F- 검정은 기본적으로 (SSR / k) / (SSE / (n-k-1))입니다. (SSR : 회귀 제곱의 합 SSE : 오차 제곱의 합). H0에서 : β = 0, 상단은 중앙 카이 제곱 (따라서 중앙이 아닌 F)을 갖습니다. 그렇지 않으면 비 중앙 테스트 통계를 따릅니다. 따라서 t와 F 사이의 관계를 알고 싶다면 단순 선형 회귀에 대해 생각해보십시오. Y = Xb + a (b는 스칼라), b에 대한 t- 검정과 전체 F 검정은 동일합니다.
  3. (일원) ANOVA의 경우 다음과 관련된 많은 통계 자료가 있습니다. 전체 등급이 아닌 X 행렬과 추정 할 수있는 함수에 대한 부담을 드리고 싶지 않습니다.하지만 기본 아이디어는 예를 들어 covid-19에서 4 가지 치료를 받았으며 다음과 같은 차이가 있는지 비교하고 싶습니다. 그러면 전체 F = \ sum {n = 1} ^ {4-1} (Fi) / (4-1) 총 (4-1) 선형 독립 직교 대비입니다. 따라서 전체 F가 큰 가치, 우리는 H0을 거부 할 것입니다. 4 개 그룹간에 차이가 없습니다.

Lol 몇 년 전에이 질문을했고 더 이상 혼란스럽지 않다는 것을 깨달았습니다.하지만 기회가 있다면 “여전히 관심이 있으시면”통계의 선형 모델 “책에서 자세한 설명을 확인할 수 있습니다. 책에서 한정자를 검토하던 중이 책에 부딪 혔습니다. 🙂

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다