Doufám, že mi někdo může pomoci, protože jsem s tímto problémem už nějakou dobu uvízl.
Mám panel S & P500 společností z let 2010 – 2014 a chci provést regresi včetně průmyslových a ročních fixních efektů.
Jsem začátečník v panelové analýze dat a také Stata a nemohu najít odpověď kdekoli. Jsem tak zmatený, protože si nejsem jistý, zda jsou fixní efekty pro průmysl a rok ekvivalentní efektům fixovaným na průřez a období.
Komentáře
- Jsou zde ' sa pěkné příspěvek v SJ o vysoce dimenzionálních fixních efektech, včetně kontroly dalších příkazů.
Odpověď
Řekněme, že máte nějakou kategorii proměnné $ c_i $ (např. C může být průmyslová společnost, ve které je $ i $). Důležitým matematickým bodem, který je třeba mít na paměti, je to, že spuštění regrese pevných efektů s pevnými efekty pro $ c $ je ekvivalentní spuštění pravidelné regrese s proměnnými indikátoru pro každou možnou hodnotu $ c $.
Základní strategií může být:
- use
xtset industryvar
ve Stata, což znamená, že chcete mít pevné efekty pro každou jedinečnou hodnotu industryvar. - Generujte fiktivní proměnné pro každý rok.
- Volejte
xtreg
s možnostífe
označit fixní efekty, včetně fiktivních proměnných pro rok jako proměnné na pravé straně.
Více např plicitivně můžete udělat něco jako:
xtset industry xtreg y x1 x2 i.year, fe
Předpokládá se, že year
je proměnná, která obsahuje rok, industry
je proměnná, která obsahuje odvětví atd …
Komentáře
- Vážený Matthew, děkuji tolik za vaši užitečnou odpověď. Snažil jsem se, jak jste radili ve Stata, a jsem spokojen s výsledkem, který dostanu. Vadilo by vám, kdybych se s vámi ještě jednou zkontroloval – mám 418 společností z indexu S & P 500, za 5 let 2020 – 2014, a stáhl jsem kódy SIC pro každou společnost do kontrola dopadů na průmysl. Tak jsem udělal: xtset sic; xtreg y x1 x2 x3 … i.rok, fe předem se omlouvám, pokud se vám moje otázka zdá být hloupá, ale jsem absolutní začátečník a nemám nikoho v mém Uni, kdo by mi mohl pomoci s Panelem. S pozdravem, Milica
- ano, ' takhle bys to udělal. Další náhodná myšlenka, můžete použít 4místné SIC kódy nebo můžete také vyzkoušet 3místné sic kódy (např. Vygenerovat novou proměnnou SIC3 tím, že vezmete 4místný kód, vydělíte jej 10 a zbytek oddělíte funkcí floor () tj.
gen sic3 = floor(sic4/10)
). - Děkujeme za laskavou a užitečnou odpověď. S pozdravem Milica
Odpověď
V této souvislosti je regrese s pevným efektem (nebo v rámci odhadce) metoda modelování s panelovými nebo podélnými daty. Tento odhad odlišuje průměr proměnných observační jednotky od každé proměnné:
Pro jednotlivce $ i \ in 1 \ dots N $, pozorované v obdobích $ 1 \ dots T $ a kovarianty $ X_k $ a závislá proměnná $ Y $ provede odhad odhadovaného efektu následující transformaci:
$ \ breve {Y} _ {it} = Y_ {it } – \ bar {Y} _i $ a
$ \ breve {X} _ {kit} = X_ {kit} – \ bar {X} _ {ki} $ za $ k = 1 \ tečky K $
Regrese se provádí u transformovaných proměnných. Ve stata se to provádí pomocí příkazu xtreg
s fe
možnost.
Tento příkaz pravděpodobně nebude ve vaší situaci fungovat, protože je navržen pro rozlišení průměrů pro každou pozorovací jednotku. Je pravděpodobné, že budete mít více společností, které působí v konkrétním odvětví, a chcete odlišit průměr v tomto odvětví. Toto je jednoduchý případ hierarchického lineárního modelu.
V tomto situaci, chcete použít operátor i.
v aplikaci Stata:
reg y i.industry i.year
Můžete také použít areg
příkaz pro získání stejných výsledků:
areg y i.year, absorb(industry)
Příkaz areg
může být užitečné, když je počet úrovní absorbované proměnné (počet průmyslových odvětví v tomto příkladu) vysoký.
Pokud je pravda, že ve stejném odvětví existuje více firem, jak předpokládám, pak je běžnou praxí, která je rozumná a asymptoticky podporovaná, shlukování standardních chyb na průmyslové úrovni. Ve statistice se toho obvykle dosahuje pomocí možnosti vce(cluster varname)
.Například váš příkaz regress
by se stal
reg y i.industry i.year, vce(cluster industry)
V podobné poznámce došlo k poměrně nedávnému vývoji při konstrukci obousměrných a vícecestných clusterových robustních standardních chyb (viz například publikace Cameron, Gelbach a Miller z roku 2011 v Journal of Business and Economic Statistics ). obává se šoků, které ovlivní celou sadu akcií v daném časovém období, to by stálo za implementaci. Doug Miller napsal soubor .ado s názvem cgm.ado, který implementuje jednu metodu vícenásobného shlukování.
Komentáře
- Navrhuji také seskupit chyby, pokud bude tento přístup dodržen.
- To je ' pravda. Přemýšlel jsem o přidání tohoto návrhu, ale upustil jsem od toho možná mimo rozsah. ' Přidám jej.
- I ' m se snaží zjistit, jak je xtreg, fe vůbec nevhodné, protože
reg y x i.industry i.year, vce(cluster industry)
vygeneruje identické odhady pro x jakoxtset industry
následovanéxtreg y x i.year, vce(robust)
. Zahrnutí figurín nebo ponížení na základě id je přesně to samé z pohledu matematické lineární algebry. Ve skutečnosti bude pro velké množství fiktivních proměnných výpočet xtreg rychlejší, protože 10 000 fixních efektů + 2 proměnné, které nás zajímají, by zahrnovaly řešení systému proměnných 1 0002, zatímco na transformovaných datech by to byl pouze systém 2 proměnných. - @MatthewGunn Souhlasím s vámi v případě, že průmysl je pozorovací jednotka, která je pozorována v průběhu času. Pokud však v jednom odvětví existuje více pozorovacích jednotek (firem), je třeba upravit typickou diskusi o FE a
xtreg .., fe
. Spuštěníxtset
v takovém případě způsobí chybu .: " opakované hodnoty času v panelu. " - můžete mít v jednom odvětví více firem. To je ' v pořádku, jen ' nenastavujte také tsset.