Ich mache eine Regression in Excel und ich habe Dummy-Variablen für Viertel (saisonale Werte). P-Werte für Q2 und Q3 sind signifikant, aber mein Q1-P-Wert scheint auch hoch. Ich kann Q1 nicht genau herausziehen … Was soll ich tun?

Hier ist meine Ausgabe.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Kommentare

  • Dies mag für jemanden mit mehr Wissen offensichtlich sein, aber wenn mein Benutzer dieser Ausgabe eine Prognose für Q1 anzeigt, wäre dies nicht ' nutzlos oder bestenfalls falsch? ' ist in Ordnung, den Koeffizienten ' s basierend auf Elementen mit hohen P-Werten zu belassen? Bitte helfen Sie mir Ich habe Probleme damit, mit solchen Problemen umzugehen.
  • Ich frage mich, ob das Einfügen eines Elements mit einem hohen P-Wert das gesamte Regressionsmodell zerstört. Normalerweise führe ich die Regression einfach erneut aus, ohne dass ein Element a zieht hoher P-Wert, aber in diesem Fall ' s Q1 und ich kann ' Q2 3 und 4 nicht genau ohne Q1 haben .. ~ verwirrt
  • Dies ist nicht ' nicht zum Thema gehörend, könnte aber ein Duplikat von ??? etwas sein?
  • Es muss da sein, aber jemand anderes wird ha Ich muss die Suche machen, weil es jetzt zu spät hier ist. Das Problem ist jedoch, dass die Dummys für verschiedene Quartale tatsächlich zusammen eine Variable bilden (in diesem Fall mit vier möglichen Werten, sodass Sie drei Dummys benötigen, um sie darzustellen. Diese drei Dummys bilden zusammen die Variable (In R. Solche Variablen heißen " Faktoren ". Sie sollten sich nicht die einzelnen t-Werte für jeden Koeffizienten ansehen, sondern einen F-Test erstellen für die vollständige Variable (die drei Freiheitsgrade haben wird).
  • Faktoren, wie Viertel hier, sollten immer als Gesamtheit behandelt werden. Lassen Sie die IT mit all ihren Dummys rein oder lassen Sie die IT vollständig aus Einer der einzelnen Koeffizienten ist nicht signifikant. Es handelt sich um eine Nichtausgabe.

Antwort

Um Ihre Hauptfrage zu beantworten: Wenn wir interpretieren Diese Ausgabe bedeutet, dass sich der Effekt des Q1-Dummys nicht wesentlich von 0 unterscheidet. Dies bedeutet lediglich, dass der Effekt in Q1 im Grunde der gleiche ist wie in Q4, das Ihre Referenz ist Kategorie. Es gibt also nur starke Hinweise darauf, dass der Dummy-Wert für Q2 und Q3 wichtig ist.

In einem Kommentar schreiben Sie

Sie fragen sich, ob das Einfügen eines Elements mit einem hohen P-Wert das gesamte Regressionsmodell zerstört? Normalerweise führe ich die Regression einfach erneut aus, ohne dass ein Element einen hohen P-Wert zieht, aber in diesem Fall ist es Q1 und ich kann Q2 3 und 4 nicht genau haben ohne Q1 .. ~ verwirrt

Das ist nicht großartig. Wenn Sie daran interessiert sind, ob einige, wenn überhaupt, Prädiktoren für die Vorhersage eines Ergebnisses nützlich sind, sollten Sie zunächst Tools wie Lasso oder elastische Netzregression verwenden. Diese Methoden passen ein bestraftes Modell an Ihre Daten an, ohne das schlechte Prädiktoren herausgefiltert werden Probleme mit mehreren Vergleichen. Diese Themen werden an anderer Stelle auf dieser Site ausführlich behandelt.

Kommentare

  • " das ist nicht ' t great " bedeutet Q1 in meinem Modell ist nicht ' t great? Das einzige Tool, das wir zur Verfügung haben, ist Excel mit dem Regressionsanalyse-Plugin des VBA-Toolpak. Allerdings ist der Koeffizient für Q1 nicht ' t 0. Wenn ich meinen Benutzern erlaube, Q1 auszuwählen, wird dies der Fall sein prognostizieren etwas anderes als wenn meine Benutzer für Q4 prognostizieren. Daher war ich besorgt, dies zuzulassen, da ich weiß, dass der P-Wert für Q1 so hoch ist.
  • " Different " nicht ' bedeutet nicht falsch.
  • aber die Änderung, die es " anders macht " wird von einem Eingang mit verrückt hohem P-Wert angesteuert. Scheint, als sollte ich ' nicht zulassen, dass es die Prognose beeinflusst. Das ' ist im Wesentlichen meine ganze Frage. Aufgrund Ihrer Eingaben habe ich festgestellt, dass ich mir keine Sorgen machen sollte,

, aber ich bin nicht ganz sicher, ob ich verstehe, warum nicht.

  • Sie sollten versuchen zu verstehen, aber Zumindest keine Sorge! Ihre Sorge ohne Verständnis könnte die Sache nur noch schlimmer machen.
  • @JohnsonJason, Der Vorschlag, LASSO oder ein elastisches Netz zu verwenden, ist in Ordnung , falls das Ziel die Vorhersage ist. Beachten Sie jedoch, dass erklärende Modellierung und prädiktive Modellierung unterschiedliche Probleme lösen. Eine schöne Übersicht finden Sie in Shmueli " Erklären oder Vorhersagen " (2010). Da das OP es nicht explizit macht, sollte ich dies beachten.
  • Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.