Mein Ansatz muss einen fundamentalen Fehler enthalten. Beginnen wir mit der Feststellung, dass wir eine einfache Regression mit zwei Variablen $ X_t $ und $ Y_t $ haben:
$ Y_t = BX_t + e_t $
Wobei $ B $ der Koeffizient ist und $ e_t $ ist der Fehlerterm. Nehmen Sie als nächstes die erste Differenz der genannten Gleichung, indem Sie $ Y_ {t-1} $ von beiden Seiten entfernen:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Ersetzen Sie $ Y_ {t-1} $ durch die erste Gleichung:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
Die erste Differenzregression wird oft auf diese Weise dargestellt, aber dann Wenn es tatsächlich ausgeführt wird, wird es ausgeführt, indem $ X_t $ und $ Y_t $ durch ihre Differenzen ersetzt werden und nicht indem $ Y_ {t-1} $ von beiden Seiten subtrahiert wird:
$ ΔY_t = B_1ΔX_t + v_t $
Wobei $ v_t $ der neue Fehlerterm der Gleichung ist. Nun sind diese Prozeduren nicht äquivalent. Warum werden sie als solche beschrieben? Warum ist der Fehlerterm des ersten Differenzmodells häufig? beschrieben als $ \ Delta e_t $, wenn dies ebenfalls nicht zutrifft, da der Fehlerterm nicht mit dem Ursprung zusammenhängt al Fehlerterm, da die geschätzte Gleichung einfach anders ist. Warum wird schließlich nicht die erste Differenzregression durchgeführt, indem $ Y_ {t-1} $ von beiden Seiten subtrahiert wird, was der ersten Gleichung äquivalente Ergebnisse liefert (in diesem Fall ohne Querschnittsdaten)?
Antwort
Tatsächlich sind die beiden Prozeduren gleich. Der Unterschied zwischen $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ und $$ \ Delta Y_t = B \ Delta X_t + v_t $$ ist, dass Sie die zweite, aber nicht die erste schätzen können, weil Sie $ \ epsilon_t $ nicht beobachten. Die erste Gleichung ist also eher ein theoretisches Modell, während die zweite die Schätzgleichung ist, die Sie in der Praxis verwenden würden. Wenn Sie $ Y_ {t-1} $ von beiden Seiten manuell manuell subtrahieren möchten, ist dies nur möglich, wenn Sie die wahren Fehler beobachten. Sie werden feststellen, dass $ v_t $ eine Schätzung von $ \ epsilon_t $ ist. Ordnen Sie das theoretische Modell und die Regressionsgleichung neu an, wenn $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ und $ \ Delta Y_t – B \ Delta X_t = v_t $, dann muss $ \ Delta wahr sein \ epsilon_t = v_t $. Stellen Sie sich ein einfaches Beispiel vor, bei dem zwei Zeiträume und $ B = 0,3 $ über die Zeit konstant sind.
$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0,3 \ cdot 4 = 1,8 \ end {array} $$
Angenommen, $ v_t $ war insgesamt eine konsistente Schätzung von $ \ epsilon_t $ Perioden (was hier zutrifft, weil wir den Datenerzeugungsprozess durch Festlegen von $ B $ deterministisch spezifiziert haben), dann ist $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ der Rest unserer zweiten Regression als Schätzung der Fehler der ersten Gleichung.
Kommentare
- Kann ' t Ich schätze das erste Modell nicht einfach durch Subtrahieren der beobachtbaren verzögerten Werte von Y von beiden Seiten, anstatt den verzögerten Wert von Y von der linken Seite und den verzögerten Wert von X von der rechten Seite zu subtrahieren. Der nicht beobachtbare Fehler muss nicht auf diese Weise berechnet werden (obwohl ich glaube, dass dies auch möglich ist). Für mich sieht es so aus, als hätten Sie den Unterschied durch die Annahme des gleichen Beta-Koeffizienten angenommen. Ja, die Fehler sind gleich, wenn der Koeffizient gleich ist. Das ist aber nicht der übliche Fall. Aus diesem Grund ist die gemeinsame Integration von Modellen so wichtig …
- Sie haben angenommen, dass $ B $ auch über die Zeit konstant ist, da es keinen Zeitindex gibt. Und im Allgemeinen können Sie $ Y_ {t-1} $ nicht einfach von beiden Seiten subtrahieren, da Sie dafür $ e_t $ beachten müssen.
- In der endgültigen Gleichung befindet sich ein Index mit dem Fehlerterm Vt. Das Schätzen dieser beiden unterschiedlichen Gleichungen führt nicht dazu, dass ' nicht zur gleichen Beta führt.
- Und was bedeutet $ B_1 $? Wenn $ B $ nicht ' t konstant ist, können Sie die Zeiträume nicht so unterscheiden, wie Sie es getan haben, weil $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Ja, das kann ich, da der geschätzte Koeffizient in der ersten und zweiten Gleichung genau gleich ist (wenn die Startwerte 0 sind – was ich angenommen habe), ist dies nicht der Fall mit der endgültigen Gleichung (also b1). Aber das Wichtigste hier ist, wenn ich Sie richtig lese, dass die erste Differenzregressionsmethode davon ausgeht, dass die B ' s für differenzierte und Niveaugleichungen gleich sind … Was klar ist im wirklichen Leben nicht der Fall. Die Schätzung von Unterschieden unterscheidet sich grundlegend von der Schätzung von Pegeln …