Jeg laver regression i excel, og jeg har dummyvariabler for kvartal (sæsonværdier) P-værdier for Q2 og Q3 er signifikante, men min Q1 P-værdi synes også høj. Jeg kan ikke nøjagtigt trække Q1 ud … Hvad skal jeg gøre?

Her er min output.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Kommentarer

  • Dette kan være indlysende for en person med mere viden, men hvis min bruger af dette output ser en prognose for Q1, ville det ikke være ' ubrugelig eller i bedste fald forkert? Det ' er okay at lade koefficienten ' være baseret på emner med høje P-værdier? Hjælp mig for at forstå. Jeg kæmper med, hvordan man håndterer disse typer problemer.
  • Spekulerer på, om inkludering af et element med en høj P-værdi ødelægger hele regressionsmodellen? Normalt kører jeg bare regressionen igen uden at en vare trækker en høj P-værdi, men i dette tilfælde ' s Q1, og jeg kan ' t nøjagtigt har Q2 3 og 4 uden Q1 .. ~ forvirret
  • Dette er ikke ' t uden for emnet, men kan være en kopi af ??? noget?
  • Det skal være der, men en anden vil ha Jeg skal søge, for nu er det for sent om aftenen her. Men spørgsmålet er, at dummys for forskellige kvartaler virkelig udgør en variabel sammen (i dette tilfælde med fire mulige værdier, så du har brug for tre dummys for at repræsentere den. Disse tre dummys sammen udgør på variabel (I R sådanne variabler kaldes " faktorer ". Du bør ikke se på de individuelle t-værdier for hver koefficient, men konstruer en F-test for den komplette variabel (som vil have tre frihedsgrader).
  • Faktorer, ligesom kvartaler her, skal altid behandles som en helhed. Lad det være inde med alle dets dummys, eller lad det udelades fuldstændigt. en af de enkelte koefficienter er ikke-signifikant er en ikke-udgave

Svar

For at besvare dit hovedspørgsmål: Hvis vi fortolker dette output betyder, at effekten af Q1-dummy ikke er signifikant forskellig fra 0, alt hvad der betyder er, at effekten i Q1 stort set er den samme som i Q4, hvilket er din reference kategori. Så der er kun stærke tegn på, at dummyværdien er vigtig for Q2 og Q3.

I en kommentar skriver du

Spekulerer på, om inkludering af et element med en høj P-værdi ødelægger hele regressionsmodellen? Normalt kører jeg bare regressionen igen uden at et element trækker en høj P-værdi, men i dette tilfælde er det Q1, og jeg kan ikke nøjagtigt have Q2 3 og 4 uden Q1 .. ~ forvirret

Dette er ikke godt. Hvis du er interesseret i, om nogle, hvis nogen, forudsigere er nyttige til at forudsige noget resultat, er et godt sted at starte med værktøjer som lasso eller elastisk netregression. Disse metoder passer til en straffet model til dine data, der filtrerer dårlige forudsigere ud uden der opstår flere sammenligningsproblemer. Disse emner diskuteres udførligt andetsteds på dette site.

Kommentarer

  • " dette er ikke ' t stor " hvilket betyder Q1 i min model er ikke ' t stor? Det eneste værktøj, vi har til rådighed, er Excel med VBA toolpak regressionsanalyseplugin. Når det er sagt, er koefficienten for Q1 ikke ' t 0, så hvis jeg tillader mine brugere at vælge Q1, vil det forudsige noget andet, end hvis mine brugere forudsiger Q4. Så jeg var bekymret for at tillade dette, da jeg ved, at P-værdien er så høj for Q1.
  • " Forskellig " ikke ' betyder ikke forkert.
  • men ændringen, der gør det til " anderledes " drives af et input med vanvittig høj P-værdi. Det ser ud til, at jeg ikke ' ikke tillader det at påvirke prognosen. At ' er i det væsentlige hele mit spørgsmål. Baseret på dit input indsamler jeg, at jeg ikke ' ikke skal bekymre mig om det, men jeg er ikke helt sikker på, at jeg forstår hvorfor ikke.
  • Du bør prøve at forstå, men i det mindste skal du ikke bekymre dig! Din bekymring uden forståelse kan kun gøre tingene værre.
  • @JohnsonJason, Forslaget om at bruge LASSO eller elastisk net er fint hvis målet er forudsigelse . Bemærk dog at forklarende modellering og forudsigelig modellering løser forskellige problemer; en flot oversigt gives i Shmueli " For at forklare eller forudsige " (2010). Da OP ikke gør det eksplicit, skal jeg dog bemærke dette.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *