Att förstå den första skillnaden regressionsmodellen

Det måste finnas ett grundläggande fel i mitt tillvägagångssätt. Låt oss börja med att säga att vi har en enkel regression med två variabler $ X_t $ och $ Y_t $:

$ Y_t = BX_t + e_t $

Där $ B $ är koefficienten och $ e_t $ är feluttrycket. Ta sedan den första skillnaden i nämnda ekvation genom att ta bort $ Y_ {t-1} $ från båda sidor:

$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $

Ersätt $ Y_ {t-1} $ från den första ekvationen:

$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $

=> $ ΔY_t = BΔX_t + Δe_t $

Den första skillnaden regression presenteras ofta på detta sätt, men sedan när det faktiskt körs, körs det genom att ersätta $ X_t $ och $ Y_t $ med deras skillnader, och inte genom att subtrahera $ Y_ {t-1} $ från båda sidor:

$ ΔY_t = B_1ΔX_t + v_t $

Där $ v_t $ är ekvationens nya felterm. Nu är dessa procedurer inte ekvivalenta, så varför beskrivs de som sådana? Ytterligare varför är felterm i den första skillnadsmodellen ofta beskrivs som $ \ Delta e_t $, när detta inte är sant eftersom felterm inte är relaterat till ursprunget al error term, eftersom den uppskattade ekvationen helt enkelt är annorlunda. Slutligen, varför är inte den första skillnaden regression utförd genom att subtrahera $ Y_ {t-1} $ från båda sidor, vilket ger motsvarande resultat till den första ekvationen (i det här fallet utan tvärsnittsdata)?

Svar

De två procedurerna är faktiskt desamma. Skillnaden mellan $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ och $$ \ Delta Y_t = B \ Delta X_t + v_t $$ är att du kan uppskatta den andra men inte den första eftersom du inte observerar $ \ epsilon_t $. Så den första ekvationen är snarare en teoretisk modell medan den andra är den uppskattningsekvation som du skulle använda i praktiken. Om du vill subtrahera $ Y_ {t-1} $ direkt från båda sidor manuellt kan detta bara göras om du observerar de sanna felen. Du kommer att märka att $ v_t $ är en uppskattning av $ \ epsilon_t $. Ordna om den teoretiska modellen och regressionsekvationen, om $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ och $ \ Delta Y_t – B \ Delta X_t = v_t $, så måste det vara sant att $ \ Delta \ epsilon_t = v_t $. Tänk på ett enkelt exempel med två tidsperioder och $ B = 0,3 $ är konstant över tiden.

$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$

Antag att $ v_t $ var en konsekvent uppskattning av $ \ epsilon_t $ totalt perioder (vilket är sant här för att vi har bestämt datagenereringsprocessen deterministiskt genom att fixa $ B $), då är $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ resten från vår andra regression som en uppskattning av fel i den första ekvationen.

Kommentarer

Kan ' t Jag uppskattar inte bara den första modellen genom att subtrahera de observerbara laggade värdena från Y från båda sidor, snarare än att subtrahera det fördröjda värdet av Y från vänster sida och det fördröjda värdet av X från höger sida. Inget behov av att beräkna det icke observerbara felet på detta sätt (även om jag tror att det också är möjligt). För mig ser det ut som om du har antagit skillnaden genom att anta samma beta-koefficient. Ja, felen motsvarar varandra om koefficienten råkar vara densamma. Men det är inte det vanliga fallet. Det är därför som samintegrering av modeller är så viktiga …
Du antar att $ B $ är konstant över tiden också eftersom det inte har någon tidsprenumeration. Och i allmänhet kan du inte bara subtrahera $ Y_ {t-1} $ från båda sidor eftersom du måste observera $ e_t $ för det.
Det finns ett prenumeration i den slutliga ekvationen med feltermen Vt. Att uppskatta dessa två olika ekvationer resulterar inte i ' i samma beta.
Och vad betyder $ B_1 $? Om $ B $ inte är ' t konstant kan du inte skilja tidsperioderna på det sätt du gjorde eftersom $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
Ja det kan jag, eftersom koefficienten som uppskattas kommer att vara exakt densamma i den första och andra ekvationen, (om startvärdena är 0 – vilket jag antar), så är inte fallet med den slutliga ekvationen (alltså b1). Men det viktiga är här, om jag läser dig rätt, att den första skillnaden regressionsmetoden antar att B ' för skillnader och nivåekvationer är lika … Vilket är tydligt inte fallet i verkliga livet. Uppskattning av skillnader är helt annorlunda än uppskattning i nivåer …

Svar

Kommentarer

Lämna ett svar Avbryt svar