Ich hoffe, jemand kann mir helfen, da ich seit einiger Zeit mit diesem Problem festgefahren bin.

Ich habe ein Panel von S & P500-Unternehmen von 2010 bis 2014 und möchte eine Regression mit festen Auswirkungen auf Industrie und Jahr durchführen.

Ich bin ein Anfänger in der Paneldatenanalyse und auch in Stata, und ich kann die Antwort nirgendwo finden. Ich bin so verwirrt, dass ich nicht sicher bin, ob Branchen- und Jahresfixeffekte den Querschnitts- und Periodenfixeffekten entsprechen.

Kommentare

  • Es gibt ‚ sa nett Artikel in SJ über hochdimensionale feste Effekte, einschließlich einer Überprüfung anderer Befehle.

Antwort

Nehmen wir an, Sie haben eine Kategorievariable $ c_i $ (z. B. c ist möglicherweise das Branchenunternehmen, in dem sich $ i $ befindet). Ein wichtiger mathematischer Punkt, den Sie berücksichtigen sollten, ist die Ausführung einer Regression mit festen Effekten und festen Effekten für $ c $ entspricht dem Ausführen einer regulären Regression mit Indikatorvariablen für jeden möglichen Wert von $ c $.

Eine grundlegende Strategie könnte darin bestehen,

  1. in Stata, um anzugeben, dass Sie feste Effekte für jeden eindeutigen Wert von industrialvar wünschen.
  2. Generieren Sie Dummy-Variablen für jedes Jahr.
  3. Rufen Sie mit der Option fe, um feste Effekte anzugeben, einschließlich der Dummy-Variablen für das Jahr als Variablen auf der rechten Seite.

Mehr Ex Möglicherweise können Sie Folgendes tun:

xtset industry xtreg y x1 x2 i.year, fe 

Dies setzt voraus, dass year eine Variable ist, die das Jahr industry ist eine Variable, die die Branche usw. enthält.

Kommentare

  • Lieber Matthew, danke Soviel zu Ihrer hilfreichen Antwort. Ich habe es versucht, wie Sie in Stata geraten haben, und ich bin mit dem Ergebnis, das ich erhalte, zufrieden. Würde es Ihnen etwas ausmachen, wenn ich mich noch einmal bei Ihnen erkundige? Ich habe 418 Unternehmen aus dem S & P 500-Index über einen Zeitraum von 5 Jahren 2020 – 2014 und habe SIC-Codes für jedes Unternehmen heruntergeladen Kontrolle für Industrieeffekte. So habe ich gemacht: xtset sic; xtreg y x1 x2 x3 … i. Jahr, zB entschuldige ich mich im Voraus, wenn meine Frage Ihnen albern erscheint, aber ich bin ein absoluter Anfänger und habe niemanden an meiner Uni, der mir mit Panel helfen kann. Herzliche Grüße, Milica
  • ja, das ‚ ist, wie Sie das machen würden. Ein weiterer zufälliger Gedanke: Sie könnten 4-stellige SIC-Codes verwenden oder auch 3-stellige SIC-Codes ausprobieren (z. B. eine neue Variable SIC3 generieren, indem Sie den 4-stelligen Code nehmen, durch 10 teilen und den Rest mit der Funktion floor () abschneiden, d. H. gen sic3 = floor(sic4/10)).
  • Vielen Dank für Ihre freundliche und hilfreiche Antwort. Mit freundlichen Grüßen, Milica

Antwort

In diesem Zusammenhang ist eine Regression mit festem Effekt (oder innerhalb des Schätzers) a Methode zur Modellierung mit Panel- oder Längsschnittdaten. Dieser Schätzer unterscheidet den Durchschnitt der Variablen der Beobachtungseinheit von jeder Variablen:

Für Individuen $ i \ in 1 \ Punkten N $, beobachtet in Perioden $ 1 \ Punkte T $, und Kovariaten $ X_k $ und der abhängigen Variablen $ Y $ führt der Schätzer für feste Effekte die folgende Transformation durch:

$ \ breve {Y} _ {it} = Y_ {it } – \ bar {Y} _i $ und
$ \ breve {X} _ {kit} = X_ {kit} – \ bar {X} _ {ki} $ für $ k = 1 \ dots K $

Die Regression wird für die transformierten Variablen durchgeführt. In stata wird dies mit dem Befehl xtreg mit dem Befehl fe Option.

Dieser Befehl funktioniert in Ihrer Situation wahrscheinlich nicht, da er zum Differenzieren von Durchschnittswerten für jede Beobachtungseinheit ausgelegt ist Mehrere Unternehmen, die in einer bestimmten Branche tätig sind, und Sie möchten den Branchendurchschnitt unterscheiden. Dies ist ein einfacher Fall eines hierarchischen linearen Modells.

Hier In dieser Situation möchten Sie den Operator i. in Stata verwenden:

reg y i.industry i.year 

Sie können auch die areg Befehl, um identische Ergebnisse zu erhalten:

areg y i.year, absorb(industry) 

Der Befehl areg kann sein nützlich, wenn die Anzahl der Ebenen der absorbierten Variablen (die Anzahl der Branchen in diesem Beispiel) hoch ist.

Wenn es stimmt, dass es innerhalb derselben Branche mehrere Unternehmen gibt, wie ich vermute, ist dies der Fall. Dann ist es eine gängige Praxis, die vernünftig ist und asymptotisch unterstützt wird, Ihre Standardfehler auf Branchenebene zu gruppieren. In Daten wird dies normalerweise mit der Option vce(cluster varname) erreicht.So würde beispielsweise Ihr Befehl regress zu

reg y i.industry i.year, vce(cluster industry) 

. In ähnlicher Hinsicht hat sich eine relativ neue Entwicklung ergeben wurde bei der Erstellung von robusten Standardfehlern für Zweiwege- und Mehrwegecluster erstellt (siehe z. B. das Papier von Cameron, Gelbach und Miller aus dem Jahr 2011 im Journal of Business and Economic Statistics ) Doug Miller hat eine .ado-Datei mit dem Namen cgm.ado geschrieben, die eine Methode für das Multiway-Clustering implementiert.

Kommentare

  • Ich würde auch vorschlagen, die Fehler zu gruppieren, wenn dieser Ansatz befolgt wird.
  • Das ‚ ist wahr. Ich habe darüber nachgedacht, diesen Vorschlag hinzuzufügen, habe ihn jedoch möglicherweise nicht berücksichtigt. Ich ‚ füge ihn hinzu.
  • I ‚ Ich kämpfe darum zu sehen, wie xtreg, fe überhaupt unangemessen ist, da reg y x i.industry i.year, vce(cluster industry) generiert identische Schätzungen für x wie xtset industry gefolgt von xtreg y x i.year, vce(robust). Das Einbeziehen von Dummies oder Erniedrigen basierend auf id ist aus mathematischer, linearer Algebra-Perspektive genau dasselbe. Tatsächlich berechnet das xtreg für eine große Anzahl von Dummy-Variablen schneller, da 10000 feste Effekte + 2 interessierende Variablen das Lösen eines 10002-Variablensystems beinhalten würden, während nur ein 2-Variablensystem für die transformierten Daten wäre.
  • @MatthewGunn Ich stimme Ihnen für den Fall zu, dass die Industrie eine Beobachtungseinheit ist, die im Laufe der Zeit beobachtet wird. Wenn es jedoch mehrere Beobachtungseinheiten (Unternehmen) pro Branche gibt, müssen die typische FE-Diskussion und xtreg .., fe angepasst werden. Das Ausführen von xtset in einem solchen Fall führt zu einem Fehler: “ wiederholte Zeitwerte innerhalb des Panels. “
  • Sie können mehrere Firmen pro Branche haben. Das ‚ ist in Ordnung, ‚ setzt tsset nicht auch.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.