Er moet een fundamentele fout in mijn benadering zitten. Laten we beginnen met te zeggen dat we een eenvoudige regressie hebben met twee variabelen $ X_t $ en $ Y_t $:
$ Y_t = BX_t + e_t $
Waar $ B $ de coëfficiënt is en $ e_t $ is de foutterm. Neem vervolgens het eerste verschil van de genoemde vergelijking door $ Y_ {t-1} $ van beide kanten te verwijderen:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Vervang $ Y_ {t-1} $ uit de eerste vergelijking:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
De eerste verschilregressie wordt vaak op deze manier gepresenteerd, maar dan wanneer het daadwerkelijk wordt uitgevoerd, wordt het uitgevoerd door $ X_t $ en $ Y_t $ te vervangen door hun verschillen, en niet door $ Y_ {t-1} $ van beide kanten af te trekken:
$ ΔY_t = B_1ΔX_t + v_t $
Waar $ v_t $ de nieuwe foutterm van de vergelijking is. Nu zijn deze procedures niet equivalent, dus waarom worden ze als zodanig beschreven? Waarom wordt de foutterm van het eerste verschilmodel vaak beschreven als $ \ Delta e_t $, terwijl dit ook niet waar is omdat de foutterm niet gerelateerd is aan de oorsprong een foutterm, aangezien de geschatte vergelijking gewoon anders is. Ten slotte, waarom wordt niet de eerste verschilregressie uitgevoerd door $ Y_ {t-1} $ van beide kanten af te trekken, waardoor resultaten worden verkregen die gelijk zijn aan de eerste vergelijking (in dit geval zonder gegevens over dwarsdoorsneden)?
Answer
Eigenlijk zijn de twee procedures hetzelfde. Het verschil tussen $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ en $$ \ Delta Y_t = B \ Delta X_t + v_t $$ is dat je de tweede kunt schatten, maar niet de eerste omdat je $ \ epsilon_t $ niet waarneemt. Dus de eerste vergelijking is eerder een theoretisch model, terwijl de tweede de schattingsvergelijking is die je in de praktijk zou gebruiken. Als u $ Y_ {t-1} $ direct handmatig van beide kanten wilt aftrekken, kan dit alleen worden gedaan als u de echte fouten waarneemt. U zult zien dat $ v_t $ een schatting is van $ \ epsilon_t $. Herschik het theoretische model en de regressievergelijking, als $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ en $ \ Delta Y_t – B \ Delta X_t = v_t $, dan moet het waar zijn dat $ \ Delta \ epsilon_t = v_t $. Beschouw een eenvoudig voorbeeld met twee tijdsperioden en $ B = 0.3 $ die constant is in de tijd.
$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$
Stel dat $ v_t $ een consistente schatting is van $ \ epsilon_t $ in totaal periodes (wat hier waar is omdat we het gegevensgeneratieproces deterministisch hebben gespecificeerd door $ B $ vast te stellen), dan is $ \ widehat {v} _t = \ Delta \ epsilon_t = 1.8 $ het residu van onze tweede regressie als een schatting van de fout van de eerste vergelijking.
Opmerkingen
- Can ' t Ik schat het eerste model niet simpelweg door de waarneembare vertraagde waarden af te trekken van Y van beide kanten, in plaats van de vertraagde waarde van Y van de linkerkant en de vertraagde waarde van X van de rechterkant af te trekken. Het is niet nodig om de niet-waarneembare fout op deze manier te berekenen (hoewel ik denk dat dat ook mogelijk is). Voor mij lijkt het erop dat je het verschil hebt weggenomen door dezelfde bètacoëfficiënt aan te nemen. Ja, de fouten zijn gelijk aan elkaar als de coëfficiënt dezelfde is. Maar dat is niet gebruikelijk. Dit is waarom co-integratiemodellen zo belangrijk zijn …
- Je ging ervan uit dat $ B $ ook constant zou zijn in de tijd omdat het geen tijdabonnement heeft. En in het algemeen kun je $ Y_ {t-1} $ niet zomaar van beide kanten aftrekken, want daarvoor moet je $ e_t $ in acht nemen.
- Er is een subscript in de laatste vergelijking met de foutterm Vt. Het schatten van die twee verschillende vergelijkingen levert niet ' t dezelfde bèta op.
- En wat betekent $ B_1 $? Als $ B $ n ' t constante is, kun je de tijdsperioden niet op dezelfde manier verschillen als je deed, want $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Ja dat kan, omdat de coëfficiënt die wordt geschat exact hetzelfde zal zijn in de eerste en tweede vergelijking (als de beginwaarden 0 zijn – wat ik wel heb aangenomen), is dat niet het geval met de laatste vergelijking (dus b1). Maar de belangrijkste kwestie is, als ik je goed lees, dat de eerste verschilregressiemethode ervan uitgaat dat de B ' s voor differentiaal- en niveau-vergelijkingen gelijk zijn … Dat is duidelijk niet het geval in het echte leven. Het schatten van verschillen is iets heel anders dan het schatten van niveaus …