En la regresión logística, una razón de probabilidades de 2 significa que el evento es 2 veces más probable dado un aumento de una unidad en el predictor. En la regresión de Cox, una razón de riesgo de 2 significa que el evento ocurrirá con el doble de frecuencia en cada punto de tiempo dado un aumento de una unidad en el predictor. ¿No son prácticamente lo mismo?
¿Cuál es entonces la ventaja de hacer una regresión de Cox y obtener índices de riesgo si podemos obtener funcionalmente la misma información de los índices de probabilidades de la regresión logística?
Respuesta
una razón de probabilidades de 2 significa que el evento es 2 veces más probable dado un aumento de una unidad en el predictor
Significa que las probabilidades se duplicarían, lo que no es lo mismo que la probabilidad que se duplica.
En la regresión de Cox, un índice de riesgo de 2 significa que el evento ocurrirá con el doble de frecuencia en cada momento dado un aumento de una unidad en el predictor.
Aparte de agitar un poco, sí, la tasa de ocurrencia se duplica. Es como una probabilidad instantánea escalada.
¿No son prácticamente lo mismo?
Son casi lo mismo cuando duplicar las probabilidades del evento es casi lo mismo que duplicar el riesgo del evento. No son automáticamente similares, pero en algunas circunstancias (bastante comunes) pueden corresponder muy de cerca.
Es posible que desee considerar la diferencia entre las probabilidades y la probabilidad con más atención.
Consulte , por ejemplo, la primera oración aquí , que deja en claro que las probabilidades son la relación entre una probabilidad y su complemento. Por ejemplo, aumentar las probabilidades (en favor) de 1 a 2 es lo mismo que aumentar la probabilidad de $ \ frac {1} {2} $ a $ \ frac {2} {3} $ . Las probabilidades aumentan más rápido que la probabilidad. Para probabilidades muy pequeñas, las probabilidades a favor y la probabilidad son muy similares, mientras que las probabilidades en contra se vuelven cada vez más similares a (en el sentido de que las probabilidades La razón de probabilidades irá a 1) recíprocos de probabilidad a medida que la probabilidad se vuelve pequeña. Una razón de probabilidades es simplemente la razón de dos conjuntos de probabilidades. Aumentar la razón de probabilidades mientras se mantiene una probabilidad base constante corresponde a aumentar la otra probabilidades, pero pueden o no ser similares al cambio relativo en la probabilidad.
También puede considerar la diferencia entre el peligro y la probabilidad (vea mi discusión anterior donde menciono agitar la mano; ahora no pasamos por alto la diferencia). Por ejemplo, si una probabilidad es 0,6, no puede duplicarla, pero un riesgo instantáneo de 0,6 puede duplicarse a 1,2. No son lo mismo, de la misma manera que la densidad de probabilidad no es probabilidad.
Comentarios
- +1 Solo comentando para mencionar que algunos Las formas de análisis del historial de eventos usan una definición diferente de la función de peligro (por ejemplo, $ h (t) $ en modelos de historial de eventos de tiempo discreto es la probabilidad de que un evento ocurra en el momento $ t $ condicional a que no haya ocurrido antes de ese momento , y como tal $ 2 \ times 0.6 $ no tendría sentido en tales modelos).
- Gracias, eso ' es definitivamente relevante. Esto está relacionado con el hecho que un pmf discreto puede ' t en cualquier lugar exceder 1 mientras que una densidad definitivamente puede.
Respuesta
Esta es una buena pregunta. Pero lo que realmente está preguntando no debería ser cómo se interpreta la estadística, sino qué suposiciones subyacen a cada uno de sus respectivos modelos (de riesgo o logístico). Un modelo logístico es un modelo estático que predice efectivamente el li probabilidad de que un evento ocurra en un momento particular dada la información observable. Sin embargo, un modelo de riesgo o modelo de Cox es un modelo de duración que modela las tasas de supervivencia a lo largo del tiempo. Puede hacer una pregunta como «¿Cuál es la probabilidad de que un consumidor de cigarrillos sobreviva hasta los 75 años en relación con la de un no consumidor con su regresión logística» (dado que tiene información sobre la mortalidad para una cohorte de hasta 75 años de edad) . Pero si, en cambio, desea aprovechar la totalidad de la dimensión de tiempo de sus datos, entonces usar un modelo de riesgo será más apropiado.
En última instancia, aunque realmente se reduce a lo que desea modelar. ¿Crees que lo que estás modelando es un evento único? Utilice la logística. ¿Si cree que su evento tiene una probabilidad fija o proporcional de que ocurra en cada período durante un espectro de tiempo observable? Utilice un modelo de riesgo.
La elección de métodos no debe basarse en cómo interpreta la estadística. Si este fuera el caso, no habría diferencia entre OLS, LAD, Tobit, Heckit, IV, 2SLS o una serie de otros métodos de regresión.En su lugar, debe basarse en la forma que cree que toma el modelo subyacente que está tratando de estimar.
Comentarios
- -1 (Mixto) Modelos logísticos puede ciertamente modelar las tasas de supervivencia a lo largo del tiempo. Véase, por ejemplo, Allison, P. D. (1982). Métodos de tiempo discreto para el análisis de historiales de eventos . Sociological Methodology , 13 (1982), 61–98, o Allison, P. D. (1984). Análisis del historial de eventos: regresión para datos de eventos longitudinales (Vol. 12). Sage Beverly Hills, CA.