Der må være en grundlæggende fejl i min tilgang. Lad os starte med at sige, at vi har en simpel regression med to variabler $ X_t $ og $ Y_t $:
$ Y_t = BX_t + e_t $
Hvor $ B $ er koefficienten og $ e_t $ er fejludtrykket. Tag derefter den første forskel i den nævnte ligning ved at fjerne $ Y_ {t-1} $ fra begge sider:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Erstat $ Y_ {t-1} $ fra den første ligning:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
Den første forskel regression præsenteres ofte på denne måde, men derefter når det rent faktisk køres, køres det ved at erstatte $ X_t $ og $ Y_t $ med deres forskelle og ikke ved at trække $ Y_ {t-1} $ fra begge sider:
$ ΔY_t = B_1ΔX_t + v_t $
Hvor $ v_t $ er den nye fejludtryk i ligningen. Nu er disse procedurer ikke ækvivalente, så hvorfor beskrives de som sådan? Yderligere hvorfor er fejludtrykket i den første forskelsmodel ofte beskrevet som $ \ Delta e_t $, når dette ligeledes ikke er sandt, da fejludtrykket ikke er relateret til oprindelsen al fejlbegreb, da den estimerede ligning simpelthen er forskellig. Endelig, hvorfor er ikke den første forskelsregression, der udføres ved at trække $ Y_ {t-1} $ fra begge sider, hvilket giver ækvivalente resultater til den første ligning (i dette tilfælde uden tværsnitspaneldata)?
Svar
Faktisk er de to procedurer ens. Forskellen mellem $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ og $$ \ Delta Y_t = B \ Delta X_t + v_t $$ er, at du kan estimere det andet, men ikke det første, fordi du ikke overholder $ \ epsilon_t $. Så den første ligning er snarere en teoretisk model, mens den anden er den estimeringsligning, som du ville bruge i praksis. Hvis du ønskede at trække $ Y_ {t-1} $ direkte fra begge sider manuelt, kan dette kun gøres, hvis du observerer de sande fejl. Du vil bemærke, at $ v_t $ er et skøn på $ \ epsilon_t $. Omarranger den teoretiske model og regressionsligningen, hvis $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ og $ \ Delta Y_t – B \ Delta X_t = v_t $, så skal det være sandt, at $ \ Delta \ epsilon_t = v_t $. Overvej et simpelt eksempel med to tidsperioder og $ B = 0,3 $ er konstant over tid.
$$ \ begin {array} {c | lc | r} tid & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$
Antag at $ v_t $ i alt var et ensartet estimat på $ \ epsilon_t $ perioder (hvilket er tilfældet her, fordi vi deterministisk har specificeret datagenereringsprocessen ved at fastsætte $ B $), så er $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ det resterende fra vores anden regression som et skøn over fejl i den første ligning.
Kommentarer
- Kan ' t Jeg estimerer ikke bare den første model ved at trække de observerbare forsinkede værdier af Y fra begge sider, snarere end at trække den forsinkede værdi af Y fra venstre side og den forsinkede værdi af X fra højre side. Ingen grund til at beregne den ikke-observerbare fejl på denne måde (selvom jeg tror, det også er muligt). For mig ser det ud til, at du har antaget forskellen ved at antage den samme beta-koefficient. Ja, fejlene svarer til hinanden, hvis koefficienten tilfældigvis er den samme. Men det er ikke det sædvanlige tilfælde. Dette er grunden til co-integrering af modeller er så vigtige …
- Du antog, at $ B $ også var konstant over tid, fordi den ikke har nogen tidsskrift. Og generelt kan du ikke bare trække $ Y_ {t-1} $ fra begge sider, fordi du skal observere $ e_t $ for det.
- Der er et abonnement i den endelige ligning med fejludtrykket Vt. Estimering af disse to forskellige ligninger resulterer ikke ' i den samme beta.
- Og hvad betyder $ B_1 $? Hvis $ B $ ikke er ' t konstant, kan du ikke forskelle tidsperioderne på den måde, du gjorde, fordi $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Ja det kan jeg, fordi koefficienten, der estimeres, vil være nøjagtig den samme i den første og anden ligning (hvis startværdierne er 0 – hvilket jeg antog), er det ikke tilfældet med den endelige ligning (således b1). Men det vigtige her er, hvis jeg læser dig korrekt, at den første forskel regressionsmetode antager, at B ' s for differentierede og niveauer ligninger er lige … Hvilket er klart ikke tilfældet i det virkelige liv. Estimering i forskelle er en helt anden ting end estimering i niveauer …