Nella regressione logistica, un odds ratio di 2 significa che levento è 2 volte più probabile dato un aumento di ununità nel predittore. Nella regressione di Cox, un rapporto di rischio di 2 significa che levento si verificherà due volte più spesso in ogni momento dato un aumento di ununità nel predittore. Non sono praticamente la stessa cosa?
Qual è quindi il vantaggio nel fare una regressione di Cox e ottenere rapporti di rischio se possiamo ottenere funzionalmente le stesse informazioni dagli odds ratio della regressione logistica?
Risposta
un odds ratio di 2 significa che levento è 2 volte più probabile dato un aumento di ununità nel predittore
Significa che le probabilità raddoppierebbero, il che non è la stessa cosa del raddoppio della probabilità.
Nella regressione di Cox, un rapporto di rischio di 2 significa che levento si verificherà due volte più spesso in ogni momento dato un aumento di ununità nel predittore.
A parte un po di oscillazione della mano, sì, il tasso di occorrenza raddoppia. “È come una probabilità istantanea in scala.
Non sono praticamente la stessa cosa?
Sono quasi la stessa cosa quando raddoppiare le probabilità dellevento è quasi la stessa cosa che raddoppiare il rischio dellevento. Non sono automaticamente simili, ma in alcune circostanze (abbastanza comuni) possono corrispondere molto da vicino.
Potresti considerare più attentamente la differenza tra probabilità e probabilità.
Vedi , ad esempio, la prima frase qui , che rende chiaro che le probabilità sono il rapporto tra una probabilità e il suo complemento. Quindi, ad esempio, aumentando le probabilità (in favore) da 1 a 2 equivale allaumento della probabilità da $ \ frac {1} {2} $ a $ \ frac {2} {3} $ . Le probabilità aumentano più velocemente dellaumento della probabilità. Per probabilità molto piccole, le probabilità a favore e la probabilità sono molto simili, mentre le probabilità contro diventano sempre più simili a (nel senso che la rapporto andrà a 1) reciproco di probabilità man mano che la probabilità si riduce. Un rapporto di probabilità è semplicemente il rapporto di due gruppi di probabilità. Aumentare il rapporto di probabilità mantenendo costante una quota di base corrisponde ad aumentare laltra odds, ma può o meno essere simile al cambio relativo di probabilità.
Potresti anche riflettere sulla differenza tra rischio e probabilità (vedi la mia discussione precedente in cui ho menzionato londeggiare con la mano; ora non ignoriamo la differenza). Ad esempio, se una probabilità è 0,6, non puoi raddoppiarla, ma un rischio istantaneo di 0,6 può essere raddoppiato a 1,2. Non sono la stessa cosa, nello stesso modo in cui la densità di probabilità non è probabilità.
Commenti
- +1 Solo commentando per menzionare che alcuni forme di analisi della cronologia degli eventi utilizzano una definizione diversa della funzione di rischio (ad esempio, $ h (t) $ nei modelli di cronologia degli eventi a tempo discreto è la probabilità che un evento si verifichi nel tempo $ t $ a condizione che non si sia verificato prima di quel momento , e come tale $ 2 \ times 0.6 $ non avrebbe senso in tali modelli).
- Grazie, ' è decisamente rilevante. Questo è collegato al fatto che un pmf discreto può ' t ovunque superare 1 mentre una densità può sicuramente.
Risposta
Questa è una buona domanda. Ma ciò che in realtà stai chiedendo non dovrebbe essere come viene interpretata la statistica, ma quali ipotesi sono alla base di ciascuno dei tuoi rispettivi modelli (rischio o logistico). Un modello logistico è un modello statico che predice efficacemente il li la probabilità che un evento si verifichi in un momento particolare dato linformazione osservabile. Tuttavia, un modello di rischio o modello di Cox è un modello di durata che modella i tassi di sopravvivenza nel tempo. Potresti porre una domanda come “qual è la probabilità che un consumatore di sigarette sopravviva fino alletà di 75 anni rispetto a quella di un non utilizzatore con la tua regressione logistica” (dato che hai informazioni sulla mortalità per una coorte fino a 75 anni di età) . Ma se invece vuoi sfruttare la pienezza della dimensione temporale dei tuoi dati, allora sarà più appropriato usare un modello di rischio.
In definitiva, però, si tratta davvero di ciò che vuoi modellare. Credi che quello che stai modellando sia un evento unico? Usa la logistica. Se ritieni che il tuo evento abbia una probabilità fissa o proporzionale di verificarsi in ogni periodo in uno spettro di tempo osservabile? Utilizzare un modello di rischio.
La scelta dei metodi non dovrebbe essere basata su come si interpreta la statistica. Se così fosse, non ci sarebbe differenza tra OLS, LAD, Tobit, Heckit, IV, 2SLS o una miriade di altri metodi di regressione.Dovrebbe invece essere basato sulla forma che ritieni abbia il modello sottostante che stai cercando di stimare.
Commenti
- -1 Modelli logistici (misti) può certamente modellare i tassi di sopravvivenza nel tempo. Vedere per esempio Allison, P. D. (1982). Metodi a tempo discreto per lanalisi delle cronologie degli eventi . Metodologia sociologica , 13 (1982), 61–98 o Allison, P. D. (1984). Analisi della cronologia degli eventi: regressione per i dati degli eventi longitudinali (Vol. 12). Sage Beverly Hills, CA.