Det må være en grunnleggende feil i tilnærmingen min. La oss starte med å si at vi har en enkel regresjon med to variabler $ X_t $ og $ Y_t $:

$ Y_t = BX_t + e_t $

Hvor $ B $ er koeffisienten og $ e_t $ er feiluttrykket. Deretter tar du den første forskjellen i nevnte ligning ved å fjerne $ Y_ {t-1} $ fra begge sider:

$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $

Erstatt $ Y_ {t-1} $ fra den første ligningen:

$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $

=> $ ΔY_t = BΔX_t + Δe_t $

Den første forskjellen regresjon blir ofte presentert på denne måten, men da når den faktisk kjøres, kjøres den ved å erstatte $ X_t $ og $ Y_t $ med forskjellene, og ikke ved å trekke $ Y_ {t-1} $ fra begge sider:

$ ΔY_t = B_1ΔX_t + v_t $

Hvor $ v_t $ er den nye feilperioden i ligningen. Nå er disse prosedyrene ikke likeverdige, så hvorfor blir de beskrevet som sådan? Videre hvorfor er ofte feiltermen til den første forskjellsmodellen beskrevet som $ \ Delta e_t $, når dette ikke er sant, da feiluttrykket ikke er relatert til opprinnelsen al feilbegrep, siden den estimerte ligningen ganske enkelt er annerledes. Til slutt, hvorfor er ikke den første forskjellen regresjon utført ved å trekke $ Y_ {t-1} $ fra begge sider, noe som gir tilsvarende resultater til den første ligningen (i dette tilfellet uten tverrsnittsdata)?

Svar

Egentlig er de to prosedyrene de samme. Forskjellen mellom $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ og $$ \ Delta Y_t = B \ Delta X_t + v_t $$ er at du kan estimere det andre, men ikke det første, fordi du ikke overholder $ \ epsilon_t $. Så den første ligningen er snarere en teoretisk modell, mens den andre er estimeringsligningen du vil bruke i praksis. Hvis du ønsket å trekke $ Y_ {t-1} $ direkte fra begge sider manuelt, kan dette bare gjøres hvis du observerer de sanne feilene. Du vil merke at $ v_t $ er et estimat på $ \ epsilon_t $. Omorganiser den teoretiske modellen og regresjonsligningen, hvis $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ og $ \ Delta Y_t – B \ Delta X_t = v_t $, så må det være sant at $ \ Delta \ epsilon_t = v_t $. Tenk på et enkelt eksempel med to tidsperioder og $ B = 0,3 $ er konstant over tid.

$$ \ begin {array} {c | lc | r} tid & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$

Anta at $ v_t $ var et konsekvent estimat på $ \ epsilon_t $ i alt perioder (som er sant her fordi vi deterministisk har spesifisert datagenereringsprosessen ved å fikse $ B $), så er $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ resten fra vår andre regresjon som et estimat av feil i den første ligningen.

Kommentarer

  • Kan ' t Jeg estimerer ikke bare den første modellen ved å trekke de observerbare laggede verdiene av Y fra begge sider, i stedet for å trekke lagged verdi av Y fra venstre side og lagged verdi av X fra høyre side. Ingen grunn til å beregne den ikke observerbare feilen på denne måten (selv om jeg tror det er mulig også). For meg ser det ut som om du har antatt forskjellen ved å anta den samme beta-koeffisienten. Ja feilene tilsvarer hverandre hvis koeffisienten tilfeldigvis er den samme. Men det er ikke det vanlige tilfellet. Dette er grunnen til at samintegrering av modeller er så viktige …
  • Du antok at $ B $ også var konstant over tid fordi det ikke har noe tidsskrift. Og generelt kan du ikke bare trekke $ Y_ {t-1} $ fra begge sider fordi du må observere $ e_t $ for det.
  • Det er et abonnement i den endelige ligningen med feiluttrykket Vt. Å estimere de to forskjellige ligningene resulterer ikke ' i samme beta.
  • Og hva betyr $ B_1 $? Hvis $ B $ ikke er ' t konstant, kan du ikke skille tidsperioder på den måten du gjorde fordi $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
  • Ja det kan jeg, fordi koeffisienten som blir estimert vil være nøyaktig den samme i første og andre ligning (hvis startverdiene er 0 – som jeg antok), er det ikke tilfelle med den endelige ligningen (altså b1). Men den viktige saken her er, hvis jeg leser deg riktig, at den første forskjellen regresjonsmetoden forutsetter at B ' s for differensierte og nivå ligninger er like … Hvilket er tydelig ikke tilfelle i det virkelige liv. Estimering i forskjeller er en helt annen ting enn estimering i nivåer …

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *