私はこの問題にかなり長い間立ち往生しているので、誰かが私を助けてくれることを願っています。
2010年から2014年までのS & P500企業のパネルがあり、業界と年の固定効果を含む回帰を実行したいと思います。
私はパネルデータ分析とStataの初心者ですが、どこにも答えが見つかりません。業界と年の固定効果が断面と期間の固定効果と同等であるかどうかわからないので、私はとても混乱しています。
コメント
- そこに' sa いい他のコマンドのレビューを含む、高次元の固定効果に関するSJの論文。
回答
カテゴリ変数$ c_i $があるとします(たとえば、cは$ i $が属する業界企業である可能性があります)。覚えておくべき重要な数学的なポイントは、$ cの固定効果で固定効果回帰を実行することです。 $は、$ c $の可能な値ごとにインジケーター変数を使用して通常の回帰を実行することと同じです。
基本的な戦略は次のとおりです。
- は、industryvarの一意の値ごとに固定効果が必要であることを示します。
- 毎年ダミー変数を生成します。
- と
fe
オプションを使用して、右側の変数として年のダミー変数を含む固定効果を示します。
詳細ex簡単に言うと、次のようになります。
xtset industry xtreg y x1 x2 i.year, fe
これは、year
が年を保持する変数であると想定しています。industry
は業界などを保持する変数です…
コメント
- 親愛なるマシュー、ありがとうあなたの役に立つ答えはこれだけです。私はあなたがStataでアドバイスしたように試しました、そして私は私が得た結果に満足しています。もう一度確認していただけませんか。2020年から2014年までの5年間でS & P 500インデックスから418社があり、各企業のSICコードを業界の影響の管理。したがって、私は次のことを行いました:xtset sic; xtreg y x1 x2 x3 … i.year、fe質問がばかげていると思われる場合は、事前にお詫びしますが、私はまったくの初心者であり、Panelを手伝ってくれる人はUniにいません。よろしくお願いいたします。ミリカ
- ええ、'はその方法です。別のランダムな考えでは、4桁のSICコードを使用するか、3桁のSICコードを試すこともできます(たとえば、4桁のコードを取得し、10で除算し、floor()関数で余りを切り落とすことによって新しい変数SIC3を生成します。
gen sic3 = floor(sic4/10)
)。 - 親切で役立つ回答をありがとうございます。よろしくお願いいたします。ミリカ
回答
このコンテキストでは、固定効果回帰(または推定量内)はパネルまたは縦断的データを使用してモデリングする方法。この推定量は、観測単位の変数の平均を各変数と比較します。
個人の場合$ i \ in 1 \ dots N $、期間$ 1 \ dots T $で観測され、共変量$ X_k $ 、および従属変数$ Y $の場合、固定効果推定器は次の変換を実行します。
$ \ breve {Y} _ {it} = Y_ {it }-\ bar {Y} _i $および
$ \ breve {X} _ {kit} = X_ {kit}-\ bar {X} _ {ki} $ for $ k = 1 \ dots K $
回帰は変換された変数で実行されます。stataでは、これはxtreg
コマンドとfe
オプション。
このコマンドは、各観測単位の平均を区別するように設計されているため、状況によっては機能しない可能性があります。特定の業界で事業を行っており、業界平均を比較したい複数の企業。これは、階層線形モデルの単純なケースです。
この場合状況によっては、Stataでi.
演算子を使用する必要があります:
reg y i.industry i.year
コマンド:
areg y i.year, absorb(industry)
areg
コマンドは次のようになります。吸収された変数のレベル数(この例では産業の数)が多い場合に役立ちます。
同じ業界内に複数の企業が存在する場合は、私がそう思うと思いますが、次に、業界レベルで標準エラーをクラスター化することは、良識があり、漸近的にサポートされる一般的な方法です。 stataでは、これは通常、vce(cluster varname)
オプションを使用して実行されます。したがって、たとえば、regress
コマンドは次のようになります
reg y i.industry i.year, vce(cluster industry)
同様の注意点として、かなり最近の開発では双方向および多方向クラスターの堅牢な標準誤差を構築する際に作成されました(たとえば、 Journal of Business and Economic Statistics のCameron、Gelbach、およびMillerの2011年の論文を参照してください)。特定の期間に株式のセット全体に影響を与えるショックについて心配しているので、これを実装する価値があるかもしれません。DougMillerは、マルチウェイクラスタリングの1つの方法を実装するcgm.adoという.adoファイルを作成しました。
コメント
- このアプローチに従っている場合は、エラーをクラスター化することもお勧めします。
- その'は正しいです。この提案を追加することを考えましたが、範囲外である可能性があるため控えました。'追加します。
- I ' mは、
reg y x i.industry i.year, vce(cluster industry)
は、xに対してxtset industry
の後にxtreg y x i.year, vce(robust)
と同じ推定値を生成します。ダミーを含めるか、idに基づいて侮辱することは、数学的な線形代数の観点からはまったく同じことです。実際、多数のダミー変数の場合、10000の固定効果+ 2つの対象変数は10002変数システムの解決を伴いますが、変換されたデータでは2変数システムのみであるため、xtregはより高速に計算されます。 - @MatthewGunn業界が時間の経過とともに観察される観察単位である場合、私はあなたに同意します。ただし、業界ごとに複数の観測単位(企業)がある場合は、一般的なFEディスカッションと
xtreg .., fe
を調整する必要があります。このような場合にxtset
を実行すると、エラーが発生します。:"パネル内で時間の値を繰り返しました。" - 業界ごとに複数の会社を持つことができます。 '問題ありません。' tssetも設定しないでください。