Jeg gjør regresjon i excel og har dummyvariabler for Quarter (sesongverdier) P-verdier for Q2 og Q3 er signifikante, men Q1 P-verdien min virker også høy. Jeg kan ikke nøyaktig trekke ut Q1 … Hva skal jeg gjøre?

Her er utdataene mine.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Kommentarer

  • Dette kan være åpenbart for noen med mer kunnskap, men hvis brukeren min av denne utgangen ser på en prognose for Q1, ville det ikke være ' ubrukelig, eller i beste fall feil? Det ' er greit å la koeffisienten ' være basert på varer med høye P-verdier? Hjelp meg for å forstå. Jeg sliter med hvordan jeg skal håndtere denne typen problemer.
  • Lurer du på om det å inkludere et element med høy P-verdi ødelegger hele regresjonsmodellen? Vanligvis kjører jeg bare regresjonen igjen uten at en vare trekker en høy P-verdi, men i dette tilfellet ' s Q1 og jeg kan ' t har nøyaktig Q2 3 og 4 uten Q1 .. ~ forvirret
  • Dette er ikke ' t utenfor emnet, men kan være en kopi av ??? noe?
  • Det må være der, men noen andre vil ha det Jeg må gjøre søket fordi det er for sent på kvelden her. Men problemet er at dummys for forskjellige kvartaler virkelig utgjør en variabel sammen (i dette tilfellet med fire mulige verdier, så du trenger tre dummys for å representere den. Disse tre dummysene utgjør sammen på variabel (I R slike variabler kalles " faktorer ". Du bør ikke se på de individuelle t-verdiene for hver koeffisient, men konstruere en F-test for den komplette variabelen (som vil ha tre frihetsgrader).
  • Faktorer, som kvartaler her, bør alltid behandles som en helhet. La den stå inne med alle dummiene, eller la den være fullstendig. en av de enkelte koeffisientene er ubetydelig er en ikke-utgave

Svar

For å svare på ditt hovedspørsmål: Hvis vi tolker denne utgangen betyr at effekten av Q1-dummy ikke er vesentlig forskjellig fra 0, alt som betyr er at effekten i Q1 i utgangspunktet er den samme som i Q4, som er din referanse kategori. Så det er bare sterke bevis på at dummyverdien er viktig for Q2 og Q3.

I en kommentar skriver du

Lurer du på om det å inkludere et element med høy P-verdi ødelegger hele regresjonsmodellen? Vanligvis kjører jeg bare regresjonen igjen uten at en vare trekker en høy P-verdi, men i dette tilfellet er det Q1 og jeg kan ikke akkurat ha Q2 3 og 4 uten Q1 .. ~ forvirret

Dette er ikke bra. Hvis du er interessert i om noen, om noen, prediktorer er nyttige for å forutsi noe utfall, er et godt sted å starte med verktøy som lasso eller elastisk nettregresjon. Disse metodene passer en straffet modell til dataene dine som filtrerer ut dårlige prediktorer uten som pådrar seg flere sammenligningsproblemer. Disse emnene blir diskutert utførlig andre steder på dette nettstedet.

Kommentarer

  • " dette er ikke ' t stor " som betyr Q1 i modellen min er ikke ' t stor? Det eneste verktøyet vi har tilgjengelig er Excel med VBA toolpak regresjonsanalyseplugin. Når det er sagt, er koeffisienten for Q1 ikke ' t 0, så hvis jeg lar brukerne mine velge Q1, vil det prognoser noe annerledes enn om brukerne mine forutsier Q4. Så jeg var opptatt av å tillate dette siden jeg vet at P-verdien er så høy for Q1.
  • " Forskjellig " ikke ' t betyr feil.
  • men endringen som gjør at den " forskjellig " drives av en innspill med gal høy P-verdi. Virker som om jeg ikke skal ' ikke la det påvirke prognosen. At ' egentlig er hele spørsmålet mitt. Basert på dine innspill samler jeg at jeg ikke ' ikke trenger å bekymre meg for det, men jeg er ikke helt sikker på at jeg forstår hvorfor ikke.
  • Du bør prøve å forstå, men i det minste, ikke bekymre deg! Det å bekymre deg uten forståelse kan bare gjøre saken verre.
  • @JohnsonJason, Forslaget om å bruke LASSO eller elastisk nett er fint i tilfelle målet er spådom . Merk imidlertid at forklarende modellering og prediktiv modellering løser forskjellige problemer; en fin oversikt er gitt i Shmueli " For å forklare eller forutsi " (2010). Siden OP ikke gjør det eksplisitt, må jeg merke dette.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *