Sto eseguendo una regressione in Excel e ho variabili fittizie per Trimestre (valori stagionali) I valori P per Q2 e Q3 sono significativi ma anche il mio valore P Q1 sembra alto. Non riesco a tirare fuori esattamente Q1 … Cosa devo fare?
Ecco il mio output.
Intercept Pvalue 1.3208E-08 PRD1 Pvalue .00002834 Q1 Pvalue .6863222747 <-- this one concerns me Q2 Pvalue 6.22284E-06 Q3 Pvalue 1.22817E-07 PRD2 Pvalue 0.115615524
Commenti
- Questo può essere ovvio a qualcuno con maggiori conoscenze, ma se il mio utente di questo output visualizza una previsione per Q1 non ' lo sarebbe inutile o sbagliato nella migliore delle ipotesi? ' va bene lasciare il coefficiente ' basato su articoli con valori P elevati? Per favore, aiutatemi per capire. Sto lottando con come gestire questi tipi di problemi.
- Ti chiedi se includere un elemento con un valore P elevato distrugge lintero modello di regressione? Di solito eseguo di nuovo la regressione senza che un elemento tiri un alto valore P ma in questo caso ' s Q1 e non posso ' avere esattamente Q2 3 e 4 senza Q1 .. ~ confuso
- Questo non è ' fuori tema, ma potrebbe essere un duplicato di ??? qualcosa?
- Deve essere lì, ma qualcun altro lo farà devo fare la ricerca perché ora è notte fonda qui. Ma il problema è che i manichini per quarti diversi costituiscono davvero insieme una variabile (in questo caso con quattro valori possibili, quindi hai bisogno di tre manichini per rappresentarla. Quei tre manichini insieme costituiscono una variabile (In R tali variabili sono chiamate " fattori ". Non dovresti guardare i singoli valori t per ogni coefficiente, ma costruire un test F per la variabile completa (che avrà tre gradi di libertà).
- I fattori, come i quarti qui, dovrebbero sempre essere trattati come una totalità. Lasciatelo dentro con tutti i suoi manichini, o lasciatelo fuori completamente. Quello uno dei singoli coefficienti non è significativo è un non problema
Risposta
Per rispondere alla tua domanda principale: se interpretiamo questo output significa che leffetto del manichino Q1 non è significativamente diverso da 0, tutto ciò significa che leffetto in Q1 è fondamentalmente lo stesso di Q4, che è il tuo riferimento categoria. Quindi cè solo una forte evidenza che il valore fittizio sia importante per Q2 e Q3.
In un commento, scrivi
Ti chiedi se includere un elemento con un valore P alto distrugge lintero modello di regressione? Di solito eseguo nuovamente la regressione senza un elemento che tira un valore P alto, ma in questo caso è Q1 e non posso esattamente avere Q2 3 e 4 senza Q1 .. ~ confuso
Non “t eccezionale. Se sei interessato a sapere se alcuni predittori sono utili per prevedere un risultato, un buon punto di partenza è con strumenti come lazo o regressione netta elastica. Questi metodi adattano un modello penalizzato ai dati che filtra i predittori poveri senza incorrere in più problemi di confronto. Questi argomenti sono discussi a lungo altrove in questo sito.
Commenti
- " questo non è ' t fantastico " significa che Q1 nel mio modello non è ' t ottimo? Lunico strumento che abbiamo a disposizione è Excel con il plug-in di analisi della regressione VBA toolpak. Detto questo, il coefficiente per Q1 non è ' t 0 quindi se consento ai miei utenti di selezionare Q1 lo farà prevedere qualcosa di diverso rispetto a se i miei utenti prevedessero per il quarto trimestre. Quindi ero preoccupato di consentirlo poiché so che il valore P è così alto per il primo trimestre.
- " Diverso " non funziona ' significa sbagliato.
- ma il cambiamento che lo rende " diverso " è guidato da un input con un valore P folle e alto. Sembra che non dovrei ' consentire che influenzi la previsione. Questa ' è essenzialmente tutta la mia domanda. In base al tuo contributo, mi risulta che non dovrei ' preoccuparmene, ma non sono del tutto sicuro di aver capito perché no.
- Dovresti provare a capire, ma almeno, non preoccuparti! Il tuo preoccuparti senza capire potrebbe solo peggiorare le cose.
- @JohnsonJason, Il suggerimento di usare LASSO o rete elastica va bene nel caso in cui lobiettivo sia la previsione . Tuttavia, nota che la modellazione esplicativa e la modellazione predittiva risolvono problemi diversi; una bella panoramica è fornita in Shmueli " Spiegare o prevedere " (2010). Dato che lOP non lo rende esplicito, ho pensato di farlo notare.