Deve esserci un errore fondamentale nel mio approccio. Cominciamo affermando che abbiamo una semplice regressione con due variabili $ X_t $ e $ Y_t $:
$ Y_t = BX_t + e_t $
Dove $ B $ è il coefficiente e $ e_t $ è il termine di errore. Quindi, prendi la prima differenza di detta equazione rimuovendo $ Y_ {t-1} $ da entrambi i lati:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Sostituisci $ Y_ {t-1} $ dalla prima equazione:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
La prima regressione alla differenza viene spesso presentata in questo modo, ma poi quando viene effettivamente eseguito, viene eseguito sostituendo $ X_t $ e $ Y_t $ con le loro differenze e non sottraendo $ Y_ {t-1} $ da entrambi i lati:
$ ΔY_t = B_1ΔX_t + v_t $
Dove $ v_t $ è il nuovo termine di errore dellequazione. Ora, queste procedure non sono equivalenti, quindi perché sono descritte come tali? Inoltre perché il termine di errore del primo modello di differenza è spesso descritto come $ \ Delta e_t $, quando allo stesso modo questo non è vero poiché il termine di errore non è correlato allorigine al termine di errore, poiché lequazione stimata è semplicemente diversa. Infine, perché non è la prima regressione alla differenza eseguita sottraendo $ Y_ {t-1} $ da entrambi i lati, fornendo risultati equivalenti alla prima equazione (in questo caso senza dati del pannello della sezione trasversale)?
Risposta
In realtà, le due procedure sono le stesse. La differenza tra $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ e $$ \ Delta Y_t = B \ Delta X_t + v_t $$ è che puoi stimare il secondo ma non il primo perché non osservi $ \ epsilon_t $. Quindi la prima equazione è piuttosto un modello teorico mentre la seconda è lequazione di stima che useresti nella pratica. Se si desidera sottrarre direttamente $ Y_ {t-1} $ da entrambi i lati manualmente, è possibile farlo solo se si osservano i veri errori. Noterai che $ v_t $ è una stima di $ \ epsilon_t $. Riorganizza il modello teorico e lequazione di regressione, se $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ e $ \ Delta Y_t – B \ Delta X_t = v_t $, allora deve essere vero che $ \ Delta \ epsilon_t = v_t $. Considera un semplice esempio con due periodi di tempo e $ B = 0.3 $ costante nel tempo.
$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$
Supponi che $ v_t $ fosse una stima coerente di $ \ epsilon_t $ in tutto periodi (il che è vero qui perché abbiamo specificato deterministicamente il processo di generazione dei dati fissando $ B $), quindi $ \ widehat {v} _t = \ Delta \ epsilon_t = 1.8 $ è il residuo della nostra seconda regressione come stima del errore della prima equazione.
Commenti
- Posso ' t Non sto semplicemente stimando il primo modello sottraendo i valori ritardati osservabili di Y da entrambi i lati, invece di sottrarre il valore ritardato di Y dal lato sinistro e il valore ritardato di X dal lato destro. Non è necessario calcolare lerrore non osservabile in questo modo (anche se credo che sia anche possibile). A me sembra che tu abbia assunto la differenza assumendo lo stesso coefficiente beta. Sì, gli errori sono uguali se il coefficiente è lo stesso. Ma non è il solito caso. Questo è il motivo per cui la co-integrazione dei modelli è così importante …
- Hai assunto che $ B $ sia costante nel tempo perché non ha pedici temporali. E in generale non puoi sottrarre $ Y_ {t-1} $ da entrambi i lati perché devi osservare $ e_t $ per questo.
- Cè un pedice nellequazione finale con il termine di errore Vt. La stima di queste due diverse equazioni non ' restituisce la stessa beta.
- E cosa significa $ B_1 $? Se $ B $ non è ' t costante, non puoi fare la differenza tra i periodi di tempo nel modo in cui hai fatto perché $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Sì che posso, perché il coefficiente da stimare sarà esattamente lo stesso nella prima e nella seconda equazione, (se i valori iniziali sono 0 – cosa che ho assunto), non è così con lequazione finale (quindi b1). Ma la questione importante qui è, se ti sto leggendo correttamente, che il primo metodo di regressione alla differenza presuppone che le B ' per le equazioni differenziate e di livello siano uguali … non è il caso nella vita reale. La stima delle differenze è una cosa completamente diversa dalla stima dei livelli …