Il doit y avoir une erreur fondamentale dans mon approche. Commençons par dire que nous avons une régression simple avec deux variables $ X_t $ et $ Y_t $:

$ Y_t = BX_t + e_t $

Où $ B $ est le coefficient et $ e_t $ est le terme derreur. Ensuite, prenez la première différence de ladite équation en supprimant $ Y_ {t-1} $ des deux côtés:

$ Y_t-Y_ {t-1} = BX_t + e_t – Y_ {t-1} $

Remplacez $ Y_ {t-1} $ de la première équation:

$ Y_t-Y_ {t-1} = BX_t + e_t -BX_ {t-1} -e_ {t-1} $

=> $ ΔY_t = BΔX_t + Δe_t $

La première régression par différence est souvent présentée de cette façon, mais alors quand il est réellement exécuté, il est exécuté en remplaçant $ X_t $ et $ Y_t $ par leurs différences, et non en soustrayant $ Y_ {t-1} $ des deux côtés:

$ ΔY_t = B_1ΔX_t + v_t $

Où $ v_t $ est le nouveau terme derreur de léquation. Maintenant, ces procédures ne sont pas équivalentes, alors pourquoi sont-elles décrites comme telles? En outre, pourquoi le terme derreur du premier modèle de différence est-il souvent décrit comme $ \ Delta e_t $, alors que ce nest pas non plus vrai car le terme derreur nest pas lié à lorigine terme derreur, puisque léquation estimée est simplement différente. Enfin, pourquoi la première régression par différence n’est-elle pas effectuée en soustrayant le $ Y_ {t-1} $ des deux côtés, ce qui donne des résultats équivalents à la première équation (dans ce cas sans données de panel transversales)?

Réponse

En fait, les deux procédures sont identiques. La différence entre $$ \ Delta Y_t = B \ Delta X_t + \ Delta \ epsilon_t $$ et $$ \ Delta Y_t = B \ Delta X_t + v_t $$ cest que vous pouvez estimer le second mais pas le premier car vous nobservez pas $ \ epsilon_t $. La première équation est donc plutôt un modèle théorique tandis que la seconde est léquation destimation que vous utiliseriez dans la pratique. Si vous vouliez soustraire directement $ Y_ {t-1} $ des deux côtés manuellement, cela ne peut être fait que si vous observez les vraies erreurs. Vous remarquerez que $ v_t $ est une estimation de $ \ epsilon_t $. Réorganisez le modèle théorique et léquation de régression, si $ \ Delta Y_t – B \ Delta X_t = \ Delta \ epsilon_t $ et $ \ Delta Y_t – B \ Delta X_t = v_t $, alors il doit être vrai que $ \ Delta \ epsilon_t = v_t $. Prenons un exemple simple avec deux périodes et $ B = 0,3 $ étant constant dans le temps.

$$ \ begin {array} {c | lc | r} time & Y_t & X_t & Y_t – BX_t = v_t \\ \ hline 1 & 10 & 17 & \\ 2 & 13 & 21 & \\ \ hline \ Delta & 3 & 4 & 3 – 0,3 \ cdot 4 = 1,8 \ end {array} $$

Supposons que $ v_t $ soit une estimation cohérente de $ \ epsilon_t $ en tout périodes (ce qui est vrai ici car nous avons spécifié de manière déterministe le processus de génération de données en fixant $ B $), alors $ \ widehat {v} _t = \ Delta \ epsilon_t = 1,8 $ est le résidu de notre deuxième régression comme une estimation de la erreur de la première équation.

Commentaires

  • Can ' t Je ne me contente pas destimer le premier modèle en soustrayant les valeurs retardées observables de Y des deux côtés, plutôt que de soustraire la valeur retardée de Y du côté gauche et la valeur retardée de X du côté droit. Pas besoin de calculer lerreur non observable de cette façon (même si je pense que cest également possible). Pour moi, il semble que vous ayez assumé la différence en supposant le même coefficient bêta. Oui, les erreurs sont égales si le coefficient est le même. Mais ce nest pas le cas habituel. Cest pourquoi les modèles de co-intégration sont si importants …
  • Vous avez supposé que $ B $ était également constant dans le temps car il na pas dindice de temps. Et en général, vous ne pouvez pas simplement soustraire $ Y_ {t-1} $ des deux côtés, car vous devez observer $ e_t $ pour cela.
  • Il y a un indice dans léquation finale avec le terme derreur Vt. Lestimation de ces deux équations différentes ne ' aboutit pas à la même version bêta.
  • Et que signifie $ B_1 $? Si $ B $ isn ' t constante, vous ne pouvez pas faire la différence entre les périodes de temps comme vous lavez fait car $ B_2 X_t – B_1 X_ {t-1} = (B_2 – B_1) \ Delta X_t $.
  • Oui, je peux, car le coefficient estimé sera exactement le même dans la première et la deuxième équation (si les valeurs de départ sont 0 – ce que jai supposé), ce nest pas le cas avec léquation finale (donc b1). Mais le point important ici est, si je vous lis correctement, que la première méthode de régression par différence suppose que les B ' s pour les équations différentiées et les niveaux sont égaux … Ce qui est clairement pas le cas dans la vraie vie. Lestimation des différences est complètement différente de lestimation des niveaux …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *