Debe haber un error fundamental en mi enfoque. Comencemos diciendo que tenemos una regresión simple con dos variables $ X_t $ y $ Y_t $:
$ Y_t = BX_t + e_t $
Donde $ B $ es el coeficiente y $ e_t $ es el término de error. Luego, tome la primera diferencia de dicha ecuación quitando $ Y_ {t-1} $ de ambos lados:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Sustituye $ Y_ {t-1} $ de la primera ecuación:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
La primera regresión de diferencias a menudo se presenta de esta manera, pero luego cuando se ejecuta realmente, se ejecuta reemplazando $ X_t $ y $ Y_t $ por sus diferencias, y no restando $ Y_ {t-1} $ de ambos lados:
$ ΔY_t = B_1ΔX_t + v_t $
Donde $ v_t $ es el nuevo término de error de la ecuación. Ahora bien, estos procedimientos no son equivalentes, entonces, ¿por qué se describen como tales? Además, ¿por qué el término de error del modelo de la primera diferencia a menudo descrito como $ \ Delta e_t $, cuando tampoco esto es cierto ya que el término de error no está relacionado con el origen al término de error, ya que la ecuación estimada es simplemente diferente. Finalmente, ¿por qué no se realiza la primera regresión de diferencias restando el $ Y_ {t-1} $ de ambos lados, dando resultados equivalentes a la primera ecuación (en este caso sin datos de panel transversal)?
Respuesta
En realidad, los dos procedimientos son iguales. La diferencia entre $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ y $$ \ Delta Y_t = B \ Delta X_t + v_t $$ es que puede estimar el segundo pero no el primero porque no observa $ \ epsilon_t $. Entonces, la primera ecuación es más bien un modelo teórico, mientras que la segunda es la ecuación de estimación que usaría en la práctica. Si desea restar directamente $ Y_ {t-1} $ de ambos lados manualmente, esto solo se puede hacer si observa los errores verdaderos. Notará que $ v_t $ es una estimación de $ \ epsilon_t $. Reorganice el modelo teórico y la ecuación de regresión, si $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ y $ \ Delta Y_t – B \ Delta X_t = v_t $, entonces debe ser cierto que $ \ Delta \ epsilon_t = v_t $. Considere un ejemplo simple con dos períodos de tiempo y $ B = 0.3 $ constante a lo largo del tiempo.
$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0.3 \ cdot 4 = 1.8 \ end {array} $$
Suponga que $ v_t $ es una estimación consistente de $ \ epsilon_t $ en total períodos (que es cierto aquí porque hemos especificado determinísticamente el proceso de generación de datos fijando $ B $), entonces $ \ widehat {v} _t = \ Delta \ epsilon_t = 1.8 $ es el residuo de nuestra segunda regresión como una estimación de la error de la primera ecuación.
Comentarios
- ¿Puedo ' t simplemente no estimar el primer modelo restando los valores rezagados observables de Y de ambos lados, en lugar de restar el valor retrasado de Y del lado izquierdo y el valor retrasado de X del lado derecho. No es necesario calcular el error no observable de esta manera (aunque creo que eso también es posible). Para mí, parece que ha asumido la diferencia asumiendo el mismo coeficiente beta. Sí, los errores se igualan entre sí si el coeficiente resulta ser el mismo. Pero ese no es el caso habitual. Es por eso que los modelos de cointegración son tan importantes …
- Supuso que $ B $ también es constante en el tiempo porque no tiene subíndice de tiempo. Y, en general, no puede simplemente restar $ Y_ {t-1} $ de ambos lados porque necesita observar $ e_t $ para eso.
- Hay un subíndice en la ecuación final con el término de error Vt. Estimar esas dos ecuaciones diferentes no ' t da como resultado la misma beta.
- ¿Y qué significa $ B_1 $? Si $ B $ no es ' t constante, no puede diferenciar los períodos de tiempo de la forma en que lo hizo porque $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Sí, puedo, porque el coeficiente que se estima será exactamente el mismo en la primera y la segunda ecuación (si los valores iniciales son 0, lo cual asumí), ese no es el caso con la ecuación final (por lo tanto, b1). Pero lo importante aquí es, si le estoy leyendo correctamente, que el método de regresión de la primera diferencia asume que los B ' s para las ecuaciones diferenciadas y de niveles son iguales … Lo cual es claramente no es el caso en la vida real. La estimación en diferencias es algo completamente diferente a la estimación en niveles …