Toivon, että joku voi auttaa minua, koska olen jumissa tämän ongelman kanssa jo jonkin aikaa.

Minulla on paneeli S & P500 -yrityksiä vuosina 2010-2014 ja haluan suorittaa regressiota, joka sisältää teollisuuden ja vuoden kiinteät vaikutukset.

Olen aloittelija paneelidata-analyyseissä ja myös Stata, enkä löydä vastausta mistään. Olen niin hämmentynyt, koska en ole varma, vastaavatko teollisuuden ja vuoden kiinteät vaikutukset poikkileikkauksen ja kauden kiinteitä vaikutuksia.

kommentit

  • Siellä ’ sa mukava paperi SJ: ssä suurikokoisista kiinteistä vaikutuksista, mukaan lukien katsaus muihin komentoihin.

Vastaa

Sanotaan, että sinulla on luokkamuuttuja $ c_i $ (esim. C voi olla teollisuusyritys $ i $ on). Tärkeä matemaattinen seikka, joka on pidettävä mielessä, on, että kiinteän tehosteen regressio suoritetaan kiinteillä vaikutuksilla $ c: lle $ vastaa säännöllisen regressin suorittamista indikaattorimuuttujilla kullekin mahdolliselle arvolle $ c $.

Perusstrategiana voi olla:

  1. käytä xtset industryvar Statassa ilmaisemaan, että haluat kiinteät tehosteet jokaiselle teollisuusvarren ainutlaatuiselle arvolle.
  2. Luo nuken muuttujia joka vuosi.
  3. Soita xtreg fe -vaihtoehdon avulla osoittamaan kiinteät vaikutukset, mukaan lukien vuoden nuken muuttujat oikeanpuoleisina muuttujina.

Lisää ex Voit tehdä jotain seuraavaa:

xtset industry xtreg y x1 x2 i.year, fe 

Tämä olettaa, että year on muuttuja, joka pitää vuoden, industry on muuttuja, joka pitää sisällään teollisuuden jne. …

Kommentit

  • Hyvä Matthew, kiitos niin paljon hyödyllisestä vastauksestasi. Yritin kuten neuvoit Statassa, ja olen tyytyväinen saamaani tulokseen. Haluatko, jos tarkistan vielä kerran kanssani – minulla on 418 yritystä S & P 500 -indeksistä yli 5 vuoden ajan 2020–2014, ja olen ladannut kunkin yrityksen SIC-koodit teollisuuden vaikutusten hallinta. Näin olen tehnyt: xtset sic; xtreg y x1 x2 x3 … i. vuosi, fe Pyydän anteeksi etukäteen, jos kysymykseni tuntuu sinulle typerältä, mutta olen ehdottoman aloittelija, enkä Uni: ssa ole ketään, joka voisi auttaa minua paneelissa. Ystävällisin terveisin, Milica
  • joo, että ’ miten tekisit sen. Toinen satunnainen ajatus, voit käyttää 4-numeroisia SIC-koodeja tai voit myös kokeilla 3-numeroisia sic-koodeja (esim. Luoda uusi muuttuja SIC3 ottamalla 4-numeroinen koodi, jakamalla 10: llä ja lopettamalla loput floor () -toiminnolla, ts. gen sic3 = floor(sic4/10)).
  • Kiitos ystävällisestä ja hyödyllisestä vastauksestasi. Ystävällisin terveisin, Milica

vastaus

Tässä yhteydessä kiinteän vaikutuksen regressio (tai estimaattorin sisällä) on menetelmä mallintamiseksi paneeli- tai pitkittäistiedoilla. Tämä estimaattori erottaa havaintoyksikön muuttujien keskiarvot kustakin muuttujasta:

Yksilöille $ i \ 1 \ pisteessä N $, havaittu jaksoissa $ 1 \ pisteitä T $ ja kovariaatteja $ X_k $ ja riippuva muuttuja $ Y $, kiinteän vaikutuksen estimaattori suorittaa seuraavan muunnoksen:

$ \ breve {Y} _ {it} = Y_ {it } – \ bar {Y} _i $ ja
$ \ breve {X} _ {kit} = X_ {kit} – \ bar {X} _ {ki} $ hintaan $ k = 1 \ pistettä K $

Regressio suoritetaan muunnetuille muuttujille. Tilastossa tämä toteutetaan käyttämällä xtreg -komentoa fe -vaihtoehto.

Tämä komento ei todennäköisesti toimi tilanteessasi, koska se on suunniteltu erottamaan keskiarvot jokaiselle havaintoyksikölle. Todennäköisesti sinulla on useita yrityksiä, jotka toimivat tietyllä toimialalla ja haluat erottaa alan keskiarvon. Tämä on yksinkertainen tapaus hierarkkisesta lineaarisesta mallista.

Tässä tilanteessa, haluat käyttää i. -operaattoria Statassa:

reg y i.industry i.year 

Voit käyttää myös areg -komento identtisten tulosten saamiseksi:

areg y i.year, absorb(industry) 

areg -komento voidaan hyödyllinen, kun absorboidun muuttujan tasojen määrä (tässä esimerkissä toimialojen lukumäärä) on suuri.

Jos on totta, että samalla toimialalla on useita yrityksiä, epäilen, että näin on, sitten on yleistä käytäntöä, joka on järkevää ja asymptoottisesti tuettua, klusteroida tavalliset virheesi teollisuuden tasolla. Tilastossa tämä saavutetaan tyypillisesti vaihtoehdolla vce(cluster varname).Joten esimerkiksi regress -komennostasi tulee

reg y i.industry i.year, vce(cluster industry) 

Vastaavalla huomautuksella melko uusi kehitys on kaksisuuntaisten ja monisuuntaisten klustereiden vankkoja vakiovirheitä rakennettaessa (katso esimerkiksi Cameronin, Gelbachin ja Millerin vuoden 2011 julkaisu Journal of Business and Economic Statistics ). huolestunut iskuista, jotka vaikuttavat koko osakekokonaisuuteen tiettynä ajanjaksona, tämä saattaa olla syytä toteuttaa. Doug Miller kirjoitti .ado-tiedoston nimeltä cgm.ado, joka toteuttaa yhden menetelmän monitievyöhykkeisiin.

Kommentit

  • Ehdotan myös virheiden ryhmittelyä, jos tätä lähestymistapaa noudatetaan.
  • Tämä ’ on totta. Ajattelin lisätä tämän ehdotuksen, mutta pidättäydyin kenties soveltamisalan ulkopuolella. Lisän sen ’.
  • I ’ m kamppailee nähdäkseen kuinka xtreg, fe on lainkaan sopimaton, koska reg y x i.industry i.year, vce(cluster industry) tuottaa identtiset estimaatit x: lle nimellä xtset industry, jota seuraa xtreg y x i.year, vce(robust). Mukaan lukien nuket tai halventaminen id: n perusteella on täsmälleen sama asia matemaattisesta, lineaarisesta algebran näkökulmasta. Itse asiassa suurelle määrälle näennäismuuttujia xtreg laskee nopeammin, koska 10000 kiinteää vaikutusta + 2 mielenkiintoista muuttujaa edellyttäisi 10002-muuttujajärjestelmän ratkaisemista, kun se olisi vain 2 muuttujan järjestelmä muunnetuissa tiedoissa.
  • @MatthewGunn Olen samaa mieltä kanssasi, jos teollisuus on havaintoyksikkö, jota havaitaan ajan myötä. Kuitenkin, kun toimialaa kohti on useita havaintoyksiköitä (yrityksiä), tyypillistä FE-keskustelua ja xtreg .., fe on muutettava. xtset -ajon suorittaminen tällaisessa tapauksessa johtaa virheeseen: ” toistuvat aika-arvot paneelissa. ”
  • yritykselläsi voi olla useita yrityksiä. Se ’ on hieno, älä myöskään aseta tssetiä.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *