Excel에서 회귀를 수행하고 있으며 분기 (계절 값)에 대한 더미 변수가 있습니다. Q2 및 Q3의 P 값은 중요하지만 Q1 P 값도 마찬가지입니다. 높은. Q1을 정확히 꺼낼 수 없습니다. 어떻게해야합니까?

다음은 내 출력입니다.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

댓글

  • 이것은 더 많은 지식을 가진 사람에게는 분명 할 수 있지만이 출력의 사용자가 1 분기 예측을 보면 ' 쓸모 없거나 기껏해야 잘못 되었나요? ' 높은 P 값을 가진 항목을 기반으로 계수를 ' 남겨도 괜찮습니까? 도와주세요. 이러한 유형의 문제를 처리하는 방법에 어려움을 겪고 있습니다.
  • 높은 P 값을 가진 항목을 포함하면 전체 회귀 모델이 파괴되는지 궁금합니다. 일반적으로 항목을 가져 오지 않고 회귀를 다시 실행합니다. 높은 P 값이지만이 경우 ' 1 분기이며 ' Q1 없이는 정확히 Q2 3과 4를 가질 수 없습니다 .. ~ 혼동
  • 이것은 ' 주제에서 벗어난 것은 아니지만 ??? 무언가의 중복 일 수 있습니까?
  • 거기에 있어야하지만 다른 누군가는 하 지금은 밤 늦게 여기에 있기 때문에 검색을해야합니다. 그러나 문제는 서로 다른 분기에 대한 더미가 실제로 하나의 변수를 구성한다는 것입니다 (이 경우에는 가능한 값이 4 개이므로이를 나타내려면 3 개의 더미가 필요합니다.이 3 개의 더미는 함께 변수 를 구성합니다. 이러한 변수를 " 인자 "라고합니다. 각 계수에 대한 개별 t- 값을 살펴 보지 말고 하나의 F- 검정을 구성해야합니다. 완전한 변수 (3 개의 자유도를 가짐)에 대해.
  • 여기의 분기와 같은 요소는 항상 전체로 처리되어야합니다. IT를 모든 더미와 함께 두거나 IT를 완전히 빼십시오. 개별 계수 중 하나가 중요하지 않음은 문제가되지 않음

답변

주요 질문에 답하려면 : 이 출력은 Q1 더미의 효과가 0과 크게 다르지 않다는 것을 의미합니다. 즉, Q1의 효과는 기본적으로 Q4의 효과와 동일합니다. 범주. 따라서 2 분기와 3 분기에 더미 값이 중요하다는 강력한 증거 만 있습니다.

댓글에

높은 P 값을 가진 항목을 포함하면 전체 회귀 모델이 파괴되는지 궁금하십니까? 일반적으로 높은 P 값을 가져 오는 항목없이 회귀를 다시 실행하지만이 경우에는 Q1이고 Q2 3과 4를 정확히 가질 수 없습니다. Q1 .. ~ 혼란없이

이건 좋지 않습니다. 예측 변수가 어떤 결과를 예측하는 데 유용한 지 여부에 관심이있는 경우 올가미 또는 탄력적 순 회귀와 같은 도구를 사용하는 것이 좋습니다. 이러한 방법은 데이터에 페널티 모델을 적용하여 잘못된 예측 변수를 필터링합니다. 다중 비교 문제가 발생합니다. 이러한 주제는이 사이트의 다른 곳에서 자세히 설명합니다.

댓글

  • " 이건 ' 좋지 않음 " 내 모델의 Q1이 ' 좋지 않음을 의미합니까? 사용할 수있는 유일한 도구는 VBA toolpak 회귀 분석 플러그인이있는 Excel입니다. 따라서 Q1에 대한 계수는 ' t 0이 아니므로 사용자가 Q1을 선택하도록 허용하면 사용자가 4 분기를 예측하는 것과는 다른 예측을합니다. 따라서 1 분기에 P 값이 너무 높다는 것을 알고 있으므로이를 허용하는 데 관심이있었습니다.
  • " 다름 "는 ' 잘못된 것을 의미하지는 않습니다.
  • 하지만 변화는 " 다릅니다 "는 P- 값이 엄청나게 높은 입력에 의해 주도되고 있습니다. 예측에 영향을주지 않도록 '해서는 안되는 것 같습니다. 그게 ' 본질적으로 제 전체 질문입니다. 귀하의 의견에 따르면 ' 걱정해서는 안된다고 생각하지만 그 이유를 완전히 이해하지 못했습니다.
  • 이해하려고 노력해야하지만 적어도 걱정하지 마세요! 이해하지 못하는 당신의 걱정은 상황을 더 악화시킬뿐입니다.
  • @JohnsonJason, LASSO 또는 Elastic net을 사용하라는 제안은 목표가 예측 인 경우 괜찮습니다. 그러나 설명 모델링과 예측 모델링은 다른 문제를 해결하고 있습니다. Shmueli " 설명 또는 예측 " (2010). OP는 그것을 명시하지 않기 때문에 나는 이것을 주목해야한다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다