제가이 문제를 꽤 오랫동안 겪고있는 동안 누군가가 저를 도울 수 있기를 바랍니다.

2010 년부터 2014 년까지 S & P500 회사의 패널이 있으며 산업 및 연도 고정 효과를 포함하는 회귀를 실행하고 싶습니다.

저는 패널 데이터 분석과 Stata의 초보자이며 어디에서나 답을 찾을 수 없습니다. 산업 및 연도 고정 효과가 단면적 및 기간 고정 효과와 동일한 지 확실하지 않아 혼란 스럽습니다.

댓글

답변

범주 변수 $ c_i $가 있다고 가정 해 보겠습니다 (예 : c는 $ i $가 속한 업계 회사 일 수 있음). 명심해야 할 중요한 수학적 점은 $ c에 대해 고정 효과를 사용하여 고정 효과 회귀를 실행한다는 것입니다. $는 $ c $의 가능한 각 값에 대해 표시기 변수를 사용하여 정규 회귀를 실행하는 것과 동일합니다.

기본 전략은 다음과 같습니다.

  1. 를 사용하여 Industryvar의 고유 한 각 값에 대해 고정 효과를 원함을 나타냅니다.
  2. 매년 더미 변수를 생성합니다.
  3. fe 옵션을 사용하여 연도에 대한 더미 변수를 우변 변수로 포함하여 고정 효과를 나타냅니다.

자세히 전의 암시 적으로 다음과 같이 할 수 있습니다.

xtset industry xtreg y x1 x2 i.year, fe 

year가 연도를 포함하는 변수라고 가정합니다. industry는 업계 등을 포함하는 변수입니다 …

댓글

  • Matthew에게 감사합니다. 당신의 도움이되는 대답에 너무 많이. Stata에서 조언 한대로 시도했으며 결과에 만족합니다. 다시 한번 확인해 주시겠습니까? S & P 500 지수에서 5 년 동안 2020 년부터 2014 년까지 418 개의 회사를 보유하고 있으며 각 회사의 SIC 코드를 다운로드하여 산업 효과에 대한 제어. 따라서 나는했다 : xtset sic; xtreg y x1 x2 x3 … i.year, fe 제 질문이 당신에게 어리석은 것처럼 보이면 미리 사과드립니다. 그러나 저는 절대적인 초보자이고 제 Uni에 패널을 도와 줄 사람이 없습니다. 감사합니다. Milica
  • 예, ' 그렇게 할 수 있습니다. 또 다른 임의의 생각으로는 4 자리 SIC 코드를 사용하거나 3 자리 SIC 코드를 사용해 볼 수도 있습니다 (예 : 4 자리 코드를 10으로 나누고 나머지는 floor () 함수로 잘라내어 새로운 변수 SIC3를 생성합니다. gen sic3 = floor(sic4/10)).
  • 친절하고 도움이되는 답변에 감사드립니다. 감사합니다. Milica

Answer

이 맥락에서 고정 효과 회귀 (또는 추정치 내)는 패널 또는 종단 데이터로 모델링하는 방법. 이 추정치는 각 변수에서 관측 단위 변수의 평균을 차이합니다 :

개인의 경우 $ i \ in 1 \ dots N $, 기간 $ 1 \ dots T $에서 관찰되고 $ X_k $ 공변량 , 종속 변수 $ Y $, 고정 효과 추정기는 다음 변환을 수행합니다.

$ \ breve {Y} _ {it} = Y_ {it }-\ bar {Y} _i $ 및
$ \ breve {X} _ {kit} = X_ {kit}-\ bar {X} _ {ki} $ for $ k = 1 \ dots K $

회귀는 변환 된 변수에 대해 수행됩니다. stata에서는 xtreg 명령을 fe 옵션.

이 명령은 각 관측 단위의 평균을 차등화하도록 설계 되었기 때문에 현재 상황에서 작동하지 않을 수 있습니다. 특정 산업에서 운영되는 여러 회사에서 산업 평균을 구분하려고합니다. 이는 계층 적 선형 모델의 간단한 경우입니다.

여기서는 상황에서는 Stata에서 i. 연산자를 사용하려고합니다.

reg y i.industry i.year 

areg 명령 :

areg y i.year, absorb(industry) 

areg 명령은 흡수 된 변수의 수준 (이 예에서는 산업 수)이 높을 때 유용합니다.

내가 의심하는 것과 같은 산업 내에 여러 회사가있는 것이 사실이라면, 그런 다음 업계 수준에서 표준 오류를 클러스터링하는 것이 좋은 의미이고 점근 적으로 지원되는 일반적인 관행입니다. stata에서는 일반적으로 vce(cluster varname) 옵션으로 수행됩니다.따라서 예를 들어 regress 명령은 다음과 같습니다.

reg y i.industry i.year, vce(cluster industry) 

비슷한 점에서 상당히 최근의 개발은 양방향 및 다원 클러스터 로버 스트 표준 오류를 구성 할 때 만들어졌습니다 (예 : 비즈니스 및 경제 통계 저널 에서 Cameron, Gelbach 및 Miller의 2011 년 논문 참조). 주어진 기간 동안 전체 주식에 영향을 미치는 충격에 대해 걱정하는 경우 구현할 가치가있을 수 있습니다. Doug Miller는 한 가지 다중 클러스터링 방법을 구현하는 cgm.ado라는 .ado 파일을 작성했습니다.

댓글

  • 이 접근 방식을 따를 경우 오류 클러스터링을 제안합니다.
  • 그 ' 사실입니다. 이 제안을 추가 할까 생각했지만 범위를 벗어난 것일 수 있으므로 자제했습니다. ' 추가하겠습니다.
  • ' reg y x i.industry i.year, vce(cluster industry)xtset industry 다음에 xtreg y x i.year, vce(robust)가 오는 x에 대해 동일한 추정치를 생성합니다. 더미를 포함하거나 id를 기반으로 한 비하를 포함하는 것은 수학적 선형 대수학 관점에서 똑같은 것입니다. 실제로 많은 수의 더미 변수의 경우 xtreg는 10000 개의 고정 효과 + 2 개의 관심 변수가 10002 개의 변수 시스템을 푸는 것과 관련이있는 반면 변환 된 데이터에서는 2 개의 변수 시스템이되기 때문에 더 빠르게 계산됩니다.
  • @MatthewGunn 산업이 시간이 지남에 따라 관찰되는 관찰 단위라는 경우에 동의합니다. 그러나 산업별로 여러 관측 단위 (회사)가있는 경우 일반적인 FE 토론과 xtreg .., fe를 조정해야합니다. 이러한 경우 xtset를 실행하면 오류가 발생합니다. : " 패널 내에서 반복되는 시간 값. "
  • 업종별로 여러 회사를 보유 할 수 있습니다. ' 괜찮습니다. tsset도 설정하지 마세요. '

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다