Jespère que quelquun pourra maider car je suis coincé avec ce problème depuis un certain temps.

Jai un panel dentreprises S & P500 de 2010 à 2014 et je souhaite exécuter une régression incluant les effets fixes de lindustrie et de lannée.

Je suis un débutant en analyse de données de panel et aussi en Stata, et je ne trouve la réponse nulle part. Je suis tellement confus que je ne sais pas si les effets fixes par secteur et par année sont équivalents à des effets fixes transversaux et par période.

Commentaires

  • There ‘ sa nice article dans SJ sur les effets fixes de haute dimension, y compris un examen dautres commandes.

Réponse

Supposons que vous ayez une variable de catégorie $ c_i $ (par exemple, c peut être la société industrielle dans laquelle se trouve $ i $). Un point mathématique important à garder à lesprit est que lexécution dune régression à effets fixes avec des effets fixes pour $ c $ équivaut à exécuter une régression régulière avec des variables indicatrices pour chaque valeur possible de $ c $.

Une stratégie de base pourrait être de:

  1. utiliser xtset industryvar dans Stata pour indiquer que vous souhaitez des effets fixes pour chaque valeur unique de industryvar.
  2. Générez des variables fictives pour chaque année.
  3. Appelez xtreg avec loption fe pour indiquer les effets fixes, y compris les variables fictives pour lannée comme variables de droite.

Plus ex plicitement, vous pouvez faire quelque chose comme:

xtset industry xtreg y x1 x2 i.year, fe 

Cela suppose que year est une variable qui contient lannée, industry est une variable qui contient lindustrie etc …

Commentaires

  • Cher Matthew, merci tant pis pour votre réponse utile. Jai essayé comme vous lavez conseillé dans Stata, et je suis content du résultat que jobtiens. Cela vous dérangerait-il si je vérifie à nouveau avec vous – Jai 418 entreprises de lindice S & P 500, sur 5 ans 2020-2014, et jai téléchargé les codes SIC pour chaque entreprise pour contrôle des effets de lindustrie. Ainsi jai fait: xtset sic; xtreg y x1 x2 x3 … i.year, fe Je mexcuse à lavance si ma question vous semble ridicule, mais je suis un débutant absolu et je nai personne à mon unité qui puisse maider avec Panel. Cordialement, Milica
  • ouais, que ‘ s comment vous feriez cela. Une autre pensée aléatoire, vous pouvez utiliser des codes SIC à 4 chiffres ou vous pouvez également essayer des codes sic à 3 chiffres (par exemple, générer une nouvelle variable SIC3 en prenant le code à 4 chiffres, en divisant par 10 et en coupant le reste avec la fonction floor () ie gen sic3 = floor(sic4/10)).
  • Merci pour votre réponse aimable et utile. Cordialement, Milica

Réponse

Dans ce contexte, une régression à effet fixe (ou dans lestimateur) est un méthode de modélisation avec des données de panel ou longitudinales. Cet estimateur diffère la moyenne des variables de lunité dobservation de chaque variable:

Pour les individus $ i \ en 1 \ points N $, observés dans les périodes $ 1 \ points T $, et les covariables $ X_k $ , et la variable dépendante $ Y $, lestimateur à effet fixe effectue la transformation suivante:

$ \ breve {Y} _ {it} = Y_ {it } – \ bar {Y} _i $ et
$ \ breve {X} _ {kit} = X_ {kit} – \ bar {X} _ {ki} $ pour $ k = 1 \ dots K $

La régression est effectuée sur les variables transformées. En stata, cela est implémenté à laide de la commande xtreg avec la fe option.

Cette commande ne fonctionnera probablement pas dans votre situation, car elle est conçue pour différencier les moyennes de chaque unité dobservation. Il est probable que vous ayez plusieurs entreprises qui opèrent dans un secteur particulier et que vous souhaitez différencier de la moyenne du secteur. Il sagit dun cas simple de modèle linéaire hiérarchique.

Dans ce situation, vous souhaitez utiliser lopérateur i. dans Stata:

reg y i.industry i.year 

Vous pouvez également utiliser areg pour obtenir des résultats identiques:

areg y i.year, absorb(industry) 

La commande areg peut être utile lorsque le nombre de niveaux de la variable absorbée (le nombre dindustries dans cet exemple) est élevé.

Sil est vrai quil y a plusieurs entreprises dans le même secteur, comme je le soupçonne dêtre le cas, alors cest une pratique courante, qui est de bon sens et asymptotiquement prise en charge, de regrouper vos erreurs standard au niveau de lindustrie. Dans les stata, cela est généralement accompli avec loption vce(cluster varname).Ainsi, par exemple, votre commande regress deviendrait

reg y i.industry i.year, vce(cluster industry) 

Sur une note similaire, un développement assez récent a ont été faites lors de la construction derreurs standard robustes de cluster bidirectionnelles et multi-voies (voir, par exemple, larticle 2011 de Cameron, Gelbach et Miller dans le Journal of Business and Economic Statistics ). Si vous êtes inquiet des chocs qui affectent lensemble des actions au cours dune période donnée, cela peut valoir la peine dêtre implémenté. Doug Miller a écrit un fichier .ado appelé cgm.ado qui implémente une méthode de clustering multi-voies.

Commentaires

  • Je suggérerais également de regrouper les erreurs si cette approche est suivie.
  • Ce ‘ est vrai. Jai pensé à ajouter cette suggestion, mais je me suis abstenu car peut-être en dehors de la portée. Je ‘ lajouterai.
  • Je ‘ jai du mal à voir en quoi xtreg, fe est du tout inapproprié puisque reg y x i.industry i.year, vce(cluster industry) générera des estimations identiques pour x comme xtset industry suivi de xtreg y x i.year, vce(robust). Inclure les mannequins ou les humiliations basées sur lid est exactement la même chose du point de vue de lalgèbre linéaire mathématique. En fait, pour un grand nombre de variables fictives, le xtreg calculera plus rapidement car 10000 effets fixes + 2 variables dintérêt impliqueraient de résoudre un système à 10002 variables alors quil ne serait quun système à 2 variables sur les données transformées.
  • @MatthewGunn Je suis daccord avec vous dans le cas où lindustrie est une unité dobservation qui sobserve dans le temps. Cependant, lorsquil y a plusieurs unités dobservation (entreprises) par industrie, alors la discussion FE typique et xtreg .., fe doivent être ajustés. Lexécution de xtset dans ce cas entraîne une erreur:  » valeurs de temps répétées dans le panneau.  »
  • vous pouvez avoir plusieurs entreprises par secteur. Cela ‘ va bien, il suffit de ‘ de définir tsset aussi.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *