Logistisessa regressiossa kertoimien suhde 2 tarkoittaa, että tapahtuma on 2 kertaa todennäköisempi, kun ennustimen yhden yksikön lisäys on. Cox-regressiossa riskisuhde 2 tarkoittaa, että tapahtuma esiintyy kaksi kertaa useammin kullakin ajankohdalla, kun ennustaja kasvaa yhden yksikön. Eivätkö nämä ole käytännössä sama asia?
Mikä on sitten etu tehdä Cox-regressio ja saada riskisuhteet, jos voimme saada toiminnallisesti samat tiedot logistisen regressio-kerrointen suhdeluvuista?
vastaus
kertoimien suhde 2 tarkoittaa, että tapahtuma on 2 kertaa todennäköisempi ennustajan yhden yksikön kasvu
Se tarkoittaa, että kertoimet kaksinkertaistuvat, mikä ei ole sama kuin todennäköisyyden kaksinkertaistuminen.
Cox-regressiossa riskisuhde 2 tarkoittaa, että tapahtuma esiintyy kaksi kertaa useammin kullakin ajankohdalla, kun ennustaja kasvaa yhdellä yksiköllä.
Pienen kättelyn lisäksi kyllä – esiintymisnopeus kaksinkertaistuu. Se on kuin skaalattu hetkellinen todennäköisyys.
Eivätkö nämä ole käytännössä sama asia?
He ovat melkein sama asia, kun tapahtuman kertoimien kaksinkertaistaminen on melkein sama kuin tapahtuman vaaran kaksinkertaistaminen. Ne eivät ole automaattisesti samanlaisia, mutta joissakin (melko yleisissä) olosuhteissa ne saattavat olla hyvin läheisiä.
Voit harkita kerrointen ja todennäköisyyksien välistä eroa tarkemmin.
Katso esimerkiksi ensimmäinen lause täällä , mikä tekee selväksi, että kertoimet ovat todennäköisyyden suhde sen komplementtiin. Esimerkiksi kertoimien lisääminen (in suosio) 1: stä 2: een on sama kuin todennäköisyys kasvaa arvosta $ \ frac {1} {2} $ arvoon $ \ frac {2} {3} $ . Kertoimet kasvavat nopeammin kuin todennäköisyydet kasvavat. Hyvin pienten todennäköisyyksien kohdalla kertoimet hyväksi ja todennäköisyydet ovat hyvin samankaltaisia, kun taas kertoimet vastakkaisiin ovat yhä samanlaisia (siinä mielessä, että suhde menee 1) todennäköisyyksien vastakohtaan, kun todennäköisyys pienenee. Kerroinsuhde on yksinkertaisesti kahden kerroinsuhteen suhde. Kerroinsuhteen lisääminen pitäen peruskertoimen vakiona samalla tavalla vastaa muiden kertoimien suurentamista. kertoimet, mutta voi olla tai ei välttämättä ole samanlainen kuin todennäköisyyden suhteellinen muutos.
Voit myös miettiä vaaran ja todennäköisyyden välistä eroa (katso edellinen keskusteluni, jossa mainitsen käsin heiluttamisen; nyt emme hämää eroa. Esimerkiksi, jos todennäköisyys on 0,6, et voi kaksinkertaistaa sitä – mutta hetkellinen vaara 0,6 voidaan kaksinkertaistaa arvoon 1,2. Ne eivät ole sama asia, samalla tavalla kuin todennäköisyystiheys ei ole todennäköisyys.
Kommentit
- +1 Kommentoimalla vain mainita, että jotkut tapahtumahistoriaanalyysin muodoissa käytetään erilaista vaaratoiminnon määritelmää (esim. $ h (t) $ erillisissä aikatapahtumahistoriamalleissa on todennäköisyys, että tapahtuma esiintyy ajankohtana $ t $, edellyttäen että sitä ei ole tapahtunut ennen kyseistä aikaa ja sellaisenaan $ 2 \ kertaa 0,6 $ ei olisi järkevää tällaisissa malleissa).
- Kiitos, että ' on ehdottomasti merkityksellistä. Tämä liittyy tosiasiaan että erillinen pmf voi ' t missä tahansa ylittää yhden, kun taas tiheys ehdottomasti voi.
Vastaa
Tämä on hyvä kysymys. Mutta mitä todella kysyt, ei pitäisi olla tilastojen tulkintaa, vaan mitä oletuksia kunkin mallisi taustalla on (vaara tai logistiikka). Logistinen malli on staattinen malli joka ennustaa tehokkaasti li: n tiettynä ajankohtana tapahtuneen tapahtuman kelihood, josta on saatu havaittavia tietoja. Vaaramalli tai Cox-malli on kuitenkin kestomalli, joka mallintaa eloonjäämisastetta ajan mittaan. Saatat kysyä esimerkiksi ”mikä on todennäköisyys, että savukkeen käyttäjä elää 75-vuotiaana verrattuna ei-käyttäjään logistisella regressiollasi” (koska sinulla on tietoa kuolleisuudesta enintään 75-vuotiaana kohortissa) . Mutta jos haluat sen sijaan hyödyntää tietojesi ajallista ulottuvuutta, vaaramallin käyttö on tarkoituksenmukaisempaa.
Loppujen lopuksi se kuitenkin tulee siihen, mitä haluat mallintaa. Uskotko mallintamasi olevan kertaluonteinen tapahtuma? Käytä logistiikkaa. Jos uskot, että tapahtumallasi on kiinteät tai suhteelliset mahdollisuudet esiintyä jokaisella jaksolla havaittavissa olevassa spektrissä? Käytä vaaramallia.
Menetelmien valinnan ei pitäisi perustua tilastosi tulkintaan. Jos näin olisi, OLS: n, LAD: n, Tobitin, Heckitin, IV: n, 2SLS: n tai useiden muiden regressiomenetelmien välillä ei olisi eroa.Sen pitäisi sen sijaan perustua siihen muotoon, jonka uskot taustalla olevan mallin, jota yrität arvioida.
Kommentit
- -1 (sekalaiset) logistiset mallit voi varmasti mallintaa selviytymisastetta ajan myötä. Katso esimerkiksi Allison, P. D. (1982). Diskreettiaikamenetelmät tapahtumahistoriaanalyysiä varten . Sosiologinen metodologia , 13 (1982), 61–98, tai Allison, P. D. (1984). Tapahtumahistoriaanalyysi: Regressio pitkittäistapahtumatiedoille (osa 12). Sage Beverly Hills, Kalifornia.