Estou fazendo uma regressão no excel e tenho variáveis fictícias para o trimestre (valores sazonais). Os valores P para o 2º e 3º trimestre são significativos, mas meu valor P do 1º trimestre também parece Alto. Não consigo retirar exatamente o primeiro trimestre … O que devo fazer?
Aqui está minha saída.
Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524
Comentários
- Isso pode ser óbvio para alguém com mais conhecimento, mas se meu usuário desse resultado visualizar uma previsão para o primeiro trimestre ' não seria inútil ou errado, na melhor das hipóteses? ' pode deixar o coeficiente ' baseado em itens com altos valores de P? Por favor me ajude para entender. Estou lutando para lidar com esses tipos de problemas.
- Quer saber se incluir um item com um valor de P alto destrói todo o modelo de regressão? Normalmente, eu apenas executo a regressão novamente sem um item puxando um alto valor P, mas neste caso ' s Q1 e eu não posso ' ter exatamente Q2 3 e 4 sem Q1 .. ~ confuso
- Isto não é ' t fora do tópico, mas pode ser uma duplicata de ??? algo?
- Deve estar lá, mas outra pessoa vai ha tenho que fazer a busca porque agora é tarde da noite aqui. Mas o problema é que os dummys para trimestres diferentes realmente constituem juntos uma variável (neste caso com quatro valores possíveis, então você precisa de três dummys para representá-lo. Esses três dummys juntos constituem na variável (In R essas variáveis são chamadas de " fatores ". Você não deve olhar para os valores t individuais para cada coeficiente, mas construir um teste F para a variável completa (que terá três graus de liberdade).
- Fatores, como quartos aqui, devem sempre ser tratados como uma totalidade. Deixe IT com todos os seus manequins, ou deixe IT fora, completamente. um dos coeficientes individuais não é significativo é um não assunto
Resposta
Para responder à sua pergunta principal: Se interpretarmos esta saída significa que o efeito da dummy Q1 não é significativamente diferente de 0, tudo isso significa que o efeito em Q1 é basicamente o mesmo que em Q4, que é sua referência categoria. Portanto, há apenas fortes evidências de que o valor fictício é importante para o segundo e terceiro trimestre.
Em um comentário, você escreve
Quer saber se a inclusão de um item com um valor P alto destrói todo o modelo de regressão? Normalmente, eu apenas executo a regressão novamente sem um item puxando um valor P alto, mas neste caso é Q1 e não posso ter exatamente Q2 3 e 4 sem Q1 .. ~ confused
Isso não é bom. Se você estiver interessado em saber se alguns, se houver, preditores são úteis para prever algum resultado, um bom lugar para começar é com ferramentas como laço ou regressão de rede elástica. Esses métodos ajustam um modelo penalizado aos seus dados que filtra preditores ruins sem incorrendo em problemas de comparações múltiplas. Esses tópicos são discutidos detalhadamente em outras partes deste site.
Comentários
- " isso não é ' t ótimo " o que significa Q1 em meu modelo não é ' ótimo? A única ferramenta que temos disponível é o Excel com o plugin de análise de regressão VBA toolpak. Dito isso, o coeficiente para Q1 não é ' t 0, portanto, se eu permitir que meus usuários selecionem Q1, ele prever algo diferente do que se meus usuários previssem para o quarto trimestre. Portanto, estava preocupado em permitir isso, pois sei que o valor P é muito alto para o primeiro trimestre.
- " Diferente " não ' t significa errado.
- mas a mudança que o está tornando " diferente " está sendo conduzido por uma entrada com valor P alto demais. Parece que não devo ' permitir que isso afete a previsão. Essa ' é essencialmente minha pergunta inteira. Com base na sua opinião, concluo que não devo ' não me preocupar com isso, mas não tenho certeza se entendi por que não.
- Você deve tentar entender, mas pelo menos, não se preocupe! Sua preocupação sem entender só pode piorar as coisas.
- @JohnsonJason, A sugestão de usar LASSO ou rede elástica está bem caso o objetivo seja a previsão . No entanto, observe que a modelagem explicativa e a modelagem preditiva estão resolvendo problemas diferentes; uma boa visão geral é fornecida em Shmueli " Para explicar ou prever " (2010). Como o OP não o torna explícito, achei que deveria observar isso.