Teen regressiota Excelissä ja minulla on nuken muuttujia vuosineljännekselle (kausiluonteiset arvot). Q2: n ja Q3: n P-arvot ovat merkittäviä, mutta Q1 P -arvoni näyttää liian korkea. En voi täsmälleen vetää Q1: tä … Mitä minun pitäisi tehdä?

Tässä on minun lähtöni.

Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524 

Kommentit

  • Tämä saattaa olla ilmeistä henkilölle, jolla on enemmän tietoa, mutta jos tämän lähdön käyttäjäni tarkastelee Q1-ennustetta, ei ' se olisi hyödytön tai parhaimmillaan väärä? Onko ' s hyvä jättää kerroin ' s perustuen kohteisiin, joilla on korkeat P-arvot? Auta minua Olen kamppaileva tämäntyyppisten ongelmien käsittelemisen kanssa.
  • Mietitkö, tuhoako koko P regressiomallin sellaisen kohteen lisääminen, jolla on suuri P-arvo? Yleensä suoritan vain regressiota uudelleen ilman, että kohde vetää korkea P-arvo, mutta tässä tapauksessa ' s Q1 ja voin ' t tarkalleen olla Q2 3 ja 4 ilman Q1 .. ~ sekoittaa
  • Tämä ei ole ' t aiheen ulkopuolella, mutta se voi olla kopio ??? jostakin?
  • Sen on oltava siellä, mutta joku muu ha Ve tehdä haku, koska nyt se on myöhään illalla täällä. Mutta asia on, että eri neljännesten nuket muodostavat todella yhden muuttujan (tässä tapauksessa neljä mahdollista arvoa, joten tarvitset kolme nuket edustamaan sitä. Nämä kolme nuket yhdessä muodostavat muuttujan (R tällaisia muuttujia kutsutaan " tekijöiksi ". Sinun ei pitäisi tarkastella kunkin kertoimen yksittäisiä t-arvoja, vaan luoda yksi F-testi koko muuttujalle (jolla on kolme vapausastetta).
  • Tekijöitä, kuten tässä neljänneksiä, tulisi aina kohdella kokonaisuutena. Jätä IT sisälle kaikkiin nukkeihinsa tai jätä se kokonaan pois. yksi yksittäisistä kertoimista on merkityksetön on ei-julkaisu

Vastaa

Vastaaminen pääkysymykseen: Jos tulkitsemme tämä lähtö tarkoittaa, että Q1-nuken vaikutus ei poikkea merkittävästi nollasta, kaikki tarkoittaa sitä, että Q1: n vaikutus on periaatteessa sama kuin Q4: ssä, mikä on referenssisi kategoria. Joten on olemassa vain vahvoja todisteita siitä, että nuken arvo on tärkeä Q2: lle ja Q3: lle.

Kirjoitat kommentissa

Mietitkö, tuhoanko koko regressiomallin sellaisen kohteen lisääminen, jolla on korkea P-arvo? Yleensä suoritan vain regressiota uudelleen ilman, että kohde vetää korkeaa P-arvoa, mutta tässä tapauksessa sen Q1 ja en voi tarkalleen olla Q2 3 ja 4 ilman Q1: tä .. ~ sekava

Tämä ei ole hienoa. Jos olet kiinnostunut siitä, ovatko jotkut ennustajat hyödyllisiä ennustettaessa tuloksia, hyvä paikka on aloittaa työkaluilla, kuten lasso tai joustava verkon regressio. Nämä menetelmät sopivat tietojesi rangaistusmalliin, joka suodattaa pois heikot ennustimet ilman aiheutuu useita vertailuongelmia. Näistä aiheista keskustellaan pitkälti muualla tällä sivustolla.

Kommentit

  • " tämä ei ole ' t suuri " mikä tarkoittaa Q1 mallissani, ei ole ' t suuri? Ainoa käytettävissä oleva työkalu on Excel, jossa on VBA toolpak-regressioanalyysilaajennus. Tästä huolimatta Q1: n kerroin ei ole ' t 0, joten jos annan käyttäjien valita Q1, se ennustaa jotain erilaista kuin jos käyttäjäni ennustaisivat Q4: tä. Joten olin huolissani tämän sallimisesta, koska tiedän, että P-arvo on niin suuri Q1: lle.
  • " Different " ei ' ei tarkoita väärää.
  • mutta muutos, joka tekee siitä " erilaisen " ohjaa tulo, jolla on hullusti korkea P-arvo. Näyttää siltä, että minun ei pitäisi ' antaa sen vaikuttaa ennusteeseen. Se ' on pohjimmiltaan koko kysymykseni. Palauteesi perusteella kerron, että minun ei pitäisi ' olla huolissani siitä, mutta en ole täysin varma, että ymmärrän miksi ei.
  • Sinun tulisi yrittää ymmärtää, mutta ainakaan, älä huoli! Huolestuneisuutesi ymmärtämättä saattaa vain pahentaa asiaa.
  • @JohnsonJason, Ehdotus käyttää LASSO: ta tai joustavaa verkkoa on hyvä siinä tapauksessa, että tavoitteena on ennustaminen . Huomaa kuitenkin, että selittävä -mallinnus ja ennakoiva -mallinnus ratkaisevat erilaisia ongelmia; mukava yleiskatsaus on annettu Shmueli " Selittämään tai ennakoimaan " (2010). Koska toimenpideohjelma ei tee siitä yksiselitteistä, minun on kuitenkin huomattava tämä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *