Ik doe regressie in Excel en ik heb dummy-variabelen voor Quarter (seizoenswaarden) P-waarden voor Q2 en Q3 zijn significant, maar mijn Q1 P-waarde lijkt ook hoog. Ik kan “Q1 niet precies uittrekken … Wat moet ik doen?
Hier is mijn uitvoer.
Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524
Reacties
- Dit kan duidelijk zijn voor iemand met meer kennis, maar als mijn gebruiker van deze output een voorspelling voor Q1 bekijkt, zou dat niet ' zijn nutteloos of op zijn best verkeerd? Het ' is oké om de coëfficiënt ' s te verlaten op basis van items met hoge P-waarden? Help me alstublieft begrijp ik. Ik heb moeite om met dit soort problemen om te gaan.
- Vraagt u zich af of het opnemen van een item met een hoge P-waarde het hele regressiemodel vernietigt? Meestal voer ik de regressie gewoon opnieuw uit zonder dat een item een hoge P-waarde, maar in dit geval ' s Q1 en ik kan ' t precies Q2 3 en 4 hebben zonder Q1 .. ~ confused
- Dit is niet ' t off-topic, maar kan een duplicaat zijn van ??? iets?
- Het moet er zijn, maar iemand anders zal ha ik moet de zoektocht doen, want nu is het hier te laat in de nacht. Maar het probleem is dat de dummys voor verschillende kwartalen eigenlijk samen één variabele vormen (in dit geval met vier mogelijke waarden, dus je hebt drie dummys nodig om deze weer te geven. Die drie dummys vormen samen een variabele (in R dergelijke variabelen worden " factors " genoemd. Je moet niet naar de individuele t-waarden voor elke coëfficiënt kijken, maar één F-test maken voor de volledige variabele (die drie vrijheidsgraden zal hebben).
- Factoren, zoals kwartalen hier, moeten altijd als een geheel worden behandeld. Laat IT met al zijn dummys erin, of laat IT helemaal weg. een van de individuele coëfficiënten is niet significant is een non-issue
Answer
Om uw hoofdvraag te beantwoorden: Als we interpreteren deze output betekent dat het effect van de Q1-dummy niet significant verschilt van 0, het enige dat betekent dat het effect in Q1 in wezen hetzelfde is als in Q4, wat uw referentie is categorie. Er is dus alleen sterk bewijs dat de dummy-waarde belangrijk is voor Q2 en Q3.
In een opmerking schrijft u
Vraagt u zich af of het opnemen van een item met een hoge P-waarde het hele regressiemodel vernietigt? Meestal voer ik de regressie gewoon opnieuw uit zonder dat een item een hoge P-waarde trekt, maar in dit geval is het Q1 en kan ik niet precies Q2 3 en 4 hebben zonder Q1 .. ~ confused
Dit is niet geweldig. Als u geïnteresseerd bent in de vraag of sommige voorspellers nuttig zijn bij het voorspellen van een uitkomst, kunt u het beste beginnen met tools zoals lasso of elastische netregressie. Deze methoden passen een bestraft model toe op uw gegevens dat slechte voorspellers filtert zonder waarbij meerdere vergelijkingsproblemen optreden. Deze onderwerpen worden elders op deze site uitvoerig besproken.
Reacties
- " dit is niet ' t geweldig " wat betekent dat Q1 in mijn model isn ' niet geweldig? De enige tool die we beschikbaar hebben is Excel met de VBA toolpak regressieanalyse-plug-in. Met dat gezegd zijnde is de coëfficiënt voor Q1 n ' t 0, dus als ik mijn gebruikers toesta om Q1 te selecteren, iets anders voorspellen dan wanneer mijn gebruikers voorspellingen doen voor Q4. Dus ik was bezorgd om dit toe te staan, omdat ik weet dat de P-waarde zo hoog is voor Q1.
- " Anders " niet ' betekent niet verkeerd.
- maar de wijziging die ervoor zorgt dat het " anders is " wordt aangestuurd door een input met een waanzinnig hoge P-waarde. Het lijkt erop dat ik ' niet zou moeten toestaan dat het de voorspelling beïnvloedt. Dat ' is in wezen mijn hele vraag. Op basis van uw input begrijp ik dat ik ' me er geen zorgen over moet maken, maar ik weet niet helemaal zeker of ik begrijp waarom niet.
- U moet proberen het te begrijpen, maar maak je in ieder geval geen zorgen! Je zorgen maken zonder het te begrijpen kan de zaak alleen maar erger maken.
- @JohnsonJason, De suggestie om LASSO of elastisch net te gebruiken is prima in het geval dat het doel voorspelling is . Merk echter op dat verklarende modellering en voorspellende modellering verschillende problemen oplossen; een mooi overzicht wordt gegeven in Shmueli " Om uit te leggen of te voorspellen " (2010). Aangezien het OP het niet expliciet maakt, zou ik dit moeten opmerken.