Fac regresie în Excel și am variabile fictive pentru trimestrul (valorile sezoniere) Valorile P pentru Q2 și Q3 sunt semnificative, dar valoarea mea Q1 P pare prea înalt. Nu pot extrage exact Q1 … Ce ar trebui să fac?

Iată rezultatul meu.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Comentarii

  • Acest lucru poate fi evident pentru cineva cu mai multe cunoștințe, dar dacă utilizatorul meu de acest rezultat vizualizează o prognoză pentru Q1 nu ar fi ' inutil, sau greșit în cel mai bun caz? Este ' în regulă să lăsați în coeficient ' s pe baza elementelor cu valori P ridicate? Vă rugăm să mă ajutați pentru a înțelege. Mă lupt cu modul de gestionare a acestor tipuri de probleme.
  • Vă întrebați dacă includerea unui articol cu o valoare P ridicată distruge întregul model de regresie? De obicei, rulez regresia din nou fără ca un articol să tragă un valoare P ridicată, dar în acest caz este ' s Q1 și pot ' să am exact Q2 3 și 4 fără Q1 .. ~ confuz
  • Acesta nu este ' off-topic, dar ar putea fi un duplicat de ??? ceva?
  • Trebuie să fie acolo, dar altcineva va ha Am făcut căutarea pentru că acum este noaptea târziu aici. Dar problema este că manechinele pentru trimestre diferite constituie într-adevăr o singură variabilă (în acest caz, cu patru valori posibile, deci aveți nevoie de trei manechine pentru ao reprezenta. Aceste trei manechine constituie împreună pe variabilă (În R astfel de variabile se numesc " factori ". Nu ar trebui să te uiți la valorile t individuale pentru fiecare coeficient, dar să construiești un test F pentru variabila completă (care va avea trei grade de libertate).
  • Factorii, cum ar fi sferturile de aici, ar trebui să fie întotdeauna tratați ca o totalitate. Lăsați IT-ul cu toate manechinele sale sau lăsați-l complet. unul dintre coeficienții individuali este nesemnificativ este o problemă neeliberată

Răspuns

Pentru a răspunde la întrebarea dvs. principală: Dacă interpretăm această ieșire înseamnă că efectul manechinului Q1 nu este semnificativ diferit de 0, tot ceea ce înseamnă este că efectul în Q1 este practic același ca în Q4, care este referința dvs. categorie. Deci, există doar dovezi puternice ale faptului că valoarea falsă este importantă pentru Q2 și Q3.

Într-un comentariu, scrieți

Vă întrebați dacă includerea unui articol cu o valoare P ridicată distruge întregul model de regresie? De obicei, rulez din nou regresia fără ca un articol să tragă o valoare P ridicată, dar în acest caz este Q1 și nu pot avea exact Q2 3 și 4 fără Q1 .. ~ confuz

Acest lucru nu este grozav. Dacă sunteți interesat dacă unii, dacă există, predictori sunt utili în prezicerea unor rezultate, un loc bun pentru a începe este cu instrumente precum lasso sau regresie netă elastică. Aceste metode se potrivesc unui model penalizat pentru datele dvs. care filtrează predictori slabi fără apar probleme multiple de comparație. Aceste subiecte sunt discutate pe larg în altă parte pe acest site.

Comentarii

  • " acest lucru nu este ' nu este grozav " adică Q1 în modelul meu nu este ' nu este grozav? Singurul instrument pe care îl avem la dispoziție este Excel cu pluginul de analiză de regresie VBA toolpak. Cu toate acestea, coeficientul pentru Q1 nu este ' t 0, așa că, dacă permit utilizatorilor mei să selecteze Q1, va fi prognozează ceva diferit decât dacă utilizatorii prevăd pentru Q4. Așa că m-am preocupat să permit acest lucru, deoarece știu că valoarea P este atât de mare pentru Q1.
  • " Diferit " doesn ' nu înseamnă greșit.
  • dar schimbarea care îl face " diferit " este condus de o intrare cu o valoare P nebună ridicată. Se pare că nu ar trebui să ' să-i permit să afecteze prognoza. Asta ' este în esență întreaga mea întrebare. Pe baza informațiilor dvs., constat că nu ar trebui să ' să-mi fac griji, dar nu sunt sigur că înțeleg de ce nu.
  • Ar trebui să înțelegeți, dar cel puțin, nu vă faceți griji! Îngrijorarea fără înțelegere ar putea doar să înrăutățească lucrurile.
  • @JohnsonJason, Sugestia de a folosi LASSO sau plasă elastică este în regulă în cazul în care scopul este predicția . Cu toate acestea, rețineți că modelarea explicativă și modelarea predictivă rezolvă diferite probleme; o prezentare generală frumoasă este oferită în Shmueli " Pentru a explica sau a prevedea " (2010). Deoarece PO nu o explică, ar trebui să observ acest lucru.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *