Jag gör regression i excel och jag har dummyvariabler för Quarter (säsongsvärden) P-värden för Q2 och Q3 är signifikanta men mitt Q1 P-värde verkar också hög. Jag kan inte exakt dra ut Q1 … Vad ska jag göra?
Här är min utdata.
Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524
Kommentarer
- Detta kan vara uppenbart för någon med mer kunskap men om min användare av denna utdata ser en prognos för Q1 skulle det inte vara ' värdelös eller i bästa fall fel? Det ' är okej att lämna i koefficient ' s baserat på objekt med höga P-värden? Snälla hjälp mig för att förstå. Jag kämpar med hur man hanterar dessa typer av problem.
- Undrar jag om det att inkludera ett objekt med högt P-värde förstör hela regressionsmodellen? Vanligtvis kör jag bara regressionen igen utan att ett objekt drar en högt P-värde men i det här fallet ' s Q1 och jag kan ' t exakt har Q2 3 och 4 utan Q1 .. ~ förvirrad
- Det här är inte ' t utanför ämnet, men kan vara en kopia av ??? något?
- Det måste vara där, men någon annan kommer ha det Jag ska göra sökningen för nu är det för sent på kvällen här. Men problemet är att dummys för olika Quarters verkligen utgör en variabel tillsammans (i det här fallet med fyra möjliga värden, så du behöver tre dummys för att representera den. Dessa tre dummys tillsammans utgör på variabel (I R sådana variabler kallas " faktorer ". Du bör inte titta på de enskilda t-värdena för varje koefficient, men konstruera ett F-test för den fullständiga variabeln (som kommer att ha tre frihetsgrader).
- Faktorer, som kvartal här, bör alltid behandlas som en helhet. Lämna IT in med alla dess dummys, eller lämna det helt. en av de enskilda koefficienterna är obetydlig är ett icke-problem
Svar
För att svara på din huvudfråga: Om vi tolkar den här utgången betyder att effekten av Q1-dummy inte skiljer sig signifikant från 0, allt som betyder är att effekten i Q1 i princip är densamma som i Q4, vilket är din referens kategori. Så det finns bara starka bevis på att dummy-värdet är viktigt för Q2 och Q3.
I en kommentar skriver du
Undrar om ett objekt med ett högt P-värde förstör hela regressionsmodellen? Vanligtvis kör jag bara regressionen igen utan att ett objekt drar ett högt P-värde men i det här fallet är det Q1 och jag kan inte exakt ha Q2 3 och 4 utan Q1 .. ~ förvirrad
Det här är inte bra. Om du är intresserad av om några, om några, prediktorer är användbara för att förutsäga något resultat, är ett bra ställe att börja med verktyg som lasso eller elastisk nätregression. Dessa metoder passar en bestraffad modell för dina data som filtrerar bort dåliga prediktorer utan med flera jämförelseproblem. Dessa ämnen diskuteras utförligt någon annanstans på denna webbplats.
Kommentarer
- " det här är inte ' t bra " vilket betyder Q1 i min modell är inte ' t bra? Det enda verktyget vi har tillgängligt är Excel med VBA toolpak regressionsanalys-plugin. Med detta sagt är koefficienten för Q1 inte ' t 0 så om jag tillåter mina användare att välja Q1 kommer det förutsäga något annorlunda än om mina användare förutsäger Q4. Så jag var intresserad av att tillåta detta eftersom jag vet att P-värdet är så högt för Q1.
- " Olika div id = ”0c1559d53a”>
inte ' betyder inte fel.