Trebuie să existe o eroare fundamentală în abordarea mea. Să începem afirmând că avem o regresie simplă cu două variabile $ X_t $ și $ Y_t $:
$ Y_t = BX_t + e_t $
Unde $ B $ este coeficientul și $ e_t $ este termenul de eroare. Apoi, luați prima diferență a ecuației menționate eliminând $ Y_ {t-1} $ de ambele părți:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Înlocuiți $ Y_ {t-1} $ din prima ecuație:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
Prima diferență de regresie este adesea prezentată în acest fel, dar apoi când se execută efectiv, se execută înlocuind $ X_t $ și $ Y_t $ cu diferențele lor și nu scăzând $ Y_ {t-1} $ din ambele părți:
$ ΔY_t = B_1ΔX_t + v_t $
Unde $ v_t $ este noul termen de eroare al ecuației. Acum, aceste proceduri nu sunt echivalente, deci de ce sunt descrise ca atare? De ce este adesea termenul de eroare al primului model de diferență descris ca $ \ Delta e_t $, când la fel acest lucru nu este adevărat deoarece termenul de eroare nu este legat de origine un termen de eroare, deoarece ecuația estimată este pur și simplu diferită. În cele din urmă, de ce nu este „prima regresie a diferenței efectuată prin scăderea $ Y_ {t-1} $ din ambele părți, oferind rezultate echivalente primei ecuații (în acest caz fără date ale panoului cu secțiuni transversale)?
Răspuns
De fapt, cele două proceduri sunt aceleași. Diferența dintre $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ și $$ \ Delta Y_t = B \ Delta X_t + v_t $$ este că puteți estima al doilea, dar nu primul, deoarece nu respectați $ \ epsilon_t $. Deci, prima ecuație este mai degrabă un model teoretic, în timp ce a doua este ecuația de estimare pe care ați folosi-o în practică. Dacă doriți să scăpați manual $ Y_ {t-1} $ din ambele părți manual, acest lucru se poate face numai dacă observați erorile adevărate. Veți observa că $ v_t $ este o estimare de $ \ epsilon_t $. Reorganizați modelul teoretic și ecuația de regresie, dacă $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ și $ \ Delta Y_t – B \ Delta X_t = v_t $, atunci trebuie să fie adevărat că $ \ Delta \ epsilon_t = v_t $. Luați în considerare un exemplu simplu cu două perioade de timp și $ B = 0.3 $ fiind constant în timp.
$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$
Să presupunem că $ v_t $ a fost o estimare consecventă de $ \ epsilon_t $ în toate perioade (ceea ce este adevărat aici pentru că am specificat deterministic procesul de generare a datelor prin fixarea $ B $), atunci $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ este reziduul din a doua regresie ca estimare a eroare a primei ecuații.
Comentarii
- Nu pot ' t să nu estimez pur și simplu primul model scăzând valorile întârziate observabile a lui Y din ambele părți, mai degrabă decât scăderea valorii decalate a lui Y din partea stângă și a valorii decalate a lui X din partea dreaptă. Nu este nevoie să calculați eroarea neobservabilă în acest fel (deși cred că este posibil și asta). Pentru mine, se pare că ați asumat diferența, asumând același coeficient beta. Da, erorile sunt egale între ele dacă coeficientul se întâmplă să fie același. Dar acesta nu este cazul obișnuit. Acesta este motivul pentru care modelele de co-integrare sunt atât de importante …
- Ați presupus că $ B $ va fi constant și în timp, deoarece nu are niciun indiciu de timp. Și, în general, nu puteți scădea doar $ Y_ {t-1} $ din ambele părți, deoarece trebuie să respectați $ e_t $ pentru asta.
- Există un indiciu în ecuația finală cu termenul de eroare Vt. Estimarea acestor două ecuații diferite nu ' are ca rezultat aceeași versiune beta.
- Și ce înseamnă $ B_1 $? Dacă $ B $ nu este ' t constantă, nu puteți diferenția perioadele de timp în felul în care ați făcut-o deoarece $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Da, pot, deoarece coeficientul estimat va fi exact același în prima și a doua ecuație (dacă valorile inițiale sunt 0 – ceea ce am presupus), nu este cazul cu ecuația finală (deci b1). Dar problema importantă aici este, dacă vă citesc corect, că prima metodă de regresie a diferenței presupune că B ' s pentru ecuațiile diferențiate și de niveluri sunt egale … Ceea ce este clar nu este cazul în viața reală. Estimarea diferențelor este complet diferită de estimarea nivelurilor …