Estoy haciendo regresión en Excel y tengo variables ficticias para el trimestre (valores estacionales) Los valores de P para el segundo y tercer trimestre son significativos, pero mi valor de P del primer trimestre parece demasiado alto. No puedo sacar exactamente Q1 … ¿Qué debo hacer?
Aquí está mi resultado.
Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524
Comentarios
- Esto puede resultar obvio para alguien con más conocimientos, pero si mi usuario de este resultado ve un pronóstico para el primer trimestre, no sería ' ¿Es inútil o, en el mejor de los casos, incorrecto? ¿Está ' bien dejar el coeficiente ' s basado en elementos con valores P altos? Por favor, ayúdeme para entender. Estoy luchando con cómo manejar este tipo de problemas.
- ¿Se pregunta si incluir un elemento con un valor P alto destruye todo el modelo de regresión? Por lo general, simplemente ejecuto la regresión nuevamente sin que un elemento extraiga un valor de P alto, pero en este caso ' es Q1 y no puedo ' t exactamente tener Q2 3 y 4 sin Q1 .. ~ confuso
- Esto no es ' t fuera de tema, pero podría ser un duplicado de ??? algo?
- Debe estar allí, pero alguien más lo hará Tengo que hacer la búsqueda porque ahora es demasiado tarde aquí. Pero el problema es que las variables ficticias para los diferentes trimestres en realidad constituyen una variable (en este caso con cuatro valores posibles, por lo que necesita tres variables ficticias para representarla. Esas tres variables ficticias juntas constituyen una variable (en R tales variables se denominan " factores ". No debe mirar los valores t individuales para cada coeficiente, pero construya una prueba F para la variable completa (que tendrá tres grados de libertad).
- Los factores, como los cuartos aquí, siempre deben tratarse como una totalidad. Déjelo con todas sus variables ficticias o déjelo fuera, por completo. uno de los coeficientes individuales no es significativo no es un problema
Respuesta
Para responder a su pregunta principal: Si interpretamos esta salida significa que el efecto de la variable ficticia Q1 no es significativamente diferente de 0, todo lo que significa es que el efecto en Q1 es básicamente el mismo que en Q4, que es su referencia categoría. Por lo tanto, solo hay pruebas sólidas de que el valor ficticio es importante para el segundo y tercer trimestre.
En un comentario, escribe
¿Se pregunta si incluir un elemento con un valor P alto destruye todo el modelo de regresión? Por lo general, simplemente ejecuto la regresión nuevamente sin que un elemento obtenga un valor P alto, pero en este caso es Q1 y no puedo tener exactamente Q2 3 y 4 sin Q1 .. ~ confuso
Esto no es genial. Si está interesado en saber si algunos predictores, si los hay, son útiles para predecir algún resultado, un buen lugar para comenzar es con herramientas como el lazo o la regresión de red elástica. Estos métodos ajustan un modelo penalizado a sus datos que filtra los predictores deficientes sin incurriendo en múltiples problemas de comparaciones. Estos temas se discuten extensamente en otra parte de este sitio.
Comentarios
- " esto no es ' t excelente ", lo que significa que Q1 en mi modelo no es ' genial? La única herramienta que tenemos disponible es Excel con el complemento de análisis de regresión del paquete de herramientas VBA. Dicho esto, el coeficiente para Q1 no es ' t 0, por lo que si permito a mis usuarios seleccionar Q1, lo hará pronosticar algo diferente que si mis usuarios pronosticaran para el cuarto trimestre. Por lo tanto, me preocupaba permitir esto porque sé que el valor de P es muy alto para el primer trimestre.
- " Diferente " no ' No significa mal.
- pero el cambio que lo hace " diferente " está siendo impulsado por una entrada con un valor P increíblemente alto. Parece que no debería ' permitir que afecte el pronóstico. Esa ' es esencialmente toda mi pregunta. De acuerdo con sus comentarios, deduzco que no debería ' no preocuparme por eso, pero no estoy completamente seguro de entender por qué no.
- Debe intentar comprender, pero al menos, ¡no te preocupes! Su preocupación sin comprender puede empeorar las cosas.
- @JohnsonJason, La sugerencia de usar LASSO o la red elástica está bien en caso de que el objetivo sea la predicción . Sin embargo, tenga en cuenta que el modelado explicativo y el modelado predictivo están resolviendo problemas diferentes; en Shmueli se ofrece una buena descripción general " Para explicar o predecir " (2010). Dado que el OP no lo hace explícito, creo que debería tener en cuenta esto.