Deve haver um erro fundamental em minha abordagem. Vamos começar afirmando que temos uma regressão simples com duas variáveis $ X_t $ e $ Y_t $:
$ Y_t = BX_t + e_t $
Onde $ B $ é o coeficiente e $ e_t $ é o termo de erro. Em seguida, pegue a primeira diferença da referida equação removendo $ Y_ {t-1} $ de ambos os lados:
$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $
Substitua $ Y_ {t-1} $ da primeira equação:
$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $
=> $ ΔY_t = BΔX_t + Δe_t $
A primeira regressão de diferença é frequentemente apresentada desta forma, mas então quando é realmente executado, é executado substituindo $ X_t $ e $ Y_t $ por suas diferenças, e não subtraindo $ Y_ {t-1} $ de ambos os lados:
$ ΔY_t = B_1ΔX_t + v_t $
Onde $ v_t $ é o novo termo de erro da equação. Agora, esses procedimentos não são equivalentes, então por que eles são descritos como tal? Além disso, por que o termo de erro do primeiro modelo de diferença é frequentemente descrito como $ \ Delta e_t $, quando da mesma forma isso não é verdade, pois o termo de erro não está relacionado à origem todo termo de erro, já que a equação estimada é simplesmente diferente. Finalmente, por que a primeira regressão de diferença não é realizada subtraindo $ Y_ {t-1} $ de ambos os lados, dando resultados equivalentes à primeira equação (neste caso, sem dados de painel de seção transversal)?
Resposta
Na verdade, os dois procedimentos são iguais. A diferença entre $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ e $$ \ Delta Y_t = B \ Delta X_t + v_t $$ é que você pode estimar o segundo, mas não o primeiro, porque você não observa $ \ epsilon_t $. Portanto, a primeira equação é um modelo teórico, enquanto a segunda é a equação de estimativa que você usaria na prática. Se você quiser subtrair $ Y_ {t-1} $ diretamente de ambos os lados manualmente, isso só pode ser feito se você observar os erros verdadeiros. Você notará que $ v_t $ é uma estimativa de $ \ epsilon_t $. Reorganize o modelo teórico e a equação de regressão, se $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ e $ \ Delta Y_t – B \ Delta X_t = v_t $, então deve ser verdade que $ \ Delta \ epsilon_t = v_t $. Considere um exemplo simples com dois períodos de tempo e $ B = 0,3 $ sendo constante ao longo do tempo.
$$ \ begin {array} {c | lc | r} tempo & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0,3 \ cdot 4 = 1,8 \ end {array} $$
Suponha que $ v_t $ fosse uma estimativa consistente de $ \ epsilon_t $ em todos períodos (o que é verdade aqui porque especificamos deterministicamente o processo de geração de dados fixando $ B $), então $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ é o resíduo de nossa segunda regressão como uma estimativa do erro da primeira equação.
Comentários
- Posso ' t Eu simplesmente não estimo o primeiro modelo subtraindo os valores defasados observáveis de Y de ambos os lados, em vez de subtrair o valor defasado de Y do lado esquerdo e o valor defasado de X do lado direito. Não há necessidade de calcular o erro não observável dessa forma (embora eu acredite que isso também seja possível). Para mim, parece que você presumiu a diferença assumindo o mesmo coeficiente beta. Sim, os erros são iguais se o coeficiente for o mesmo. Mas esse não é o caso usual. É por isso que os modelos de co-integração são tão importantes …
- Você presumiu que $ B $ fosse constante ao longo do tempo também porque não tem índice de tempo. E, em geral, você não pode simplesmente subtrair $ Y_ {t-1} $ de ambos os lados porque você precisa observar $ e_t $ para isso.
- Há um subscrito na equação final com o termo de erro Vt. Estimar essas duas equações diferentes não ' t resulta no mesmo beta.
- E o que $ B_1 $ significa? Se $ B $ isn ' t constante, você não pode diferenciar os períodos de tempo da maneira que fez porque $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
- Sim, posso, porque o coeficiente sendo estimado será exatamente o mesmo na primeira e na segunda equação (se os valores iniciais forem 0 – o que eu assumi), esse não é o caso com a equação final (portanto, b1). Mas o importante aqui é, se eu estou lendo corretamente, que o método de regressão da primeira diferença assume que os B ' s para equações diferenciadas e de níveis são iguais … O que é claramente não é o caso na vida real. A estimativa das diferenças é completamente diferente da estimativa dos níveis …