Na regressão logística, um odds ratio de 2 significa que o evento é 2 vezes mais provável dado um aumento de uma unidade no preditor. Na regressão de Cox, uma razão de risco de 2 significa que o evento ocorrerá duas vezes mais em cada ponto de tempo, dado um aumento de uma unidade no preditor. Não são praticamente a mesma coisa?
Qual então é a vantagem em fazer uma regressão de Cox e obter taxas de risco se pudermos obter funcionalmente as mesmas informações das razões de chance de regressão logística?
Resposta
um odds ratio de 2 significa que o evento é 2 vezes mais provável dado um aumento de uma unidade no preditor
Significa que as chances dobrariam, o que não é o mesmo que a probabilidade de duplicação.
Na regressão de Cox, uma razão de risco de 2 significa que o evento ocorrerá duas vezes mais frequentemente em cada ponto de tempo dado um aumento de uma unidade no preditor.
Tirando um pouco de acenar à mão, sim – a taxa de ocorrência dobra. É como uma probabilidade instantânea escalonada.
Não são praticamente a mesma coisa?
Eles são quase a mesma coisa quando dobrar as chances do evento é quase o mesmo que dobrar o risco do evento. Eles não são automaticamente semelhantes, mas em algumas circunstâncias (bastante comuns) podem corresponder muito.
Você pode considerar a diferença entre probabilidades e probabilidades com mais cuidado.
Veja , por exemplo, a primeira frase aqui , que deixa claro que as probabilidades são a razão de uma probabilidade para seu complemento. Portanto, por exemplo, aumentando as probabilidades (em favor) de 1 para 2 é o mesmo que o aumento da probabilidade de $ \ frac {1} {2} $ para $ \ frac {2} {3} $ . As probabilidades aumentam mais rápido do que as probabilidades aumentam. Para probabilidades muito pequenas, as probabilidades a favor e a probabilidade são muito semelhantes, enquanto as probabilidades contra tornam-se cada vez mais semelhantes a (no sentido de que o o rácio irá para 1) recíprocos de probabilidade à medida que a probabilidade diminui. Um odds ratio é simplesmente o rácio de dois conjuntos de probabilidades. Aumentar o odds ratio enquanto mantém uma base de probabilidades constante corresponde a aumentar o outro probabilidades, mas podem ou não ser semelhantes à mudança relativa na probabilidade.
Você também pode querer ponderar a diferença entre perigo e probabilidade (veja minha discussão anterior, onde menciono acenos de mão; agora não ignoramos a diferença. Por exemplo, se uma probabilidade é 0,6, você não pode duplicá-la – mas um risco instantâneo de 0,6 pode ser dobrado para 1,2. Eles não são a mesma coisa, da mesma forma que densidade de probabilidade não é probabilidade.
Comentários
- +1 Apenas comentando para mencionar que alguns formas de análise de histórico de eventos usam uma definição diferente da função de risco (por exemplo, $ h (t) $ em modelos de histórico de eventos de tempo discreto é a probabilidade de um evento ocorrer no tempo $ t $, condicionado a não ter ocorrido antes desse tempo e, como tal, $ 2 \ vezes 0,6 $ não faria sentido em tais modelos).
- Obrigado, isso ' é definitivamente relevante. Isso está relacionado ao fato que um pmf discreto pode ' em qualquer lugar exceder 1, enquanto uma densidade definitivamente pode.
Resposta
Esta é uma boa pergunta. Mas o que você realmente está perguntando não deve ser como a estatística é interpretada, mas quais suposições estão por trás de cada um de seus respectivos modelos (risco ou logística). Um modelo logístico é um modelo estático que efetivamente prevê o li probabilidade de um evento ocorrer em um determinado momento, dadas informações observáveis. No entanto, um modelo de risco ou modelo de Cox é um modelo de duração que modela as taxas de sobrevivência ao longo do tempo. Você pode fazer uma pergunta como “qual é a probabilidade de um usuário de cigarro sobreviver até 75 anos em relação a um não usuário com sua regressão logística” (visto que você tem informações sobre a mortalidade para uma coorte de até 75 anos de idade) . Mas se, em vez disso, você quiser aproveitar a plenitude da dimensão do tempo de seus dados, usar um modelo de risco será mais apropriado.
No final das contas, o que realmente importa é o que você deseja modelar. Você acredita que o que você está modelando é um evento único? Use logística. Se você acredita que seu evento tem uma chance fixa ou proporcional de ocorrer a cada período ao longo de um espectro de tempo observável? Use um modelo de risco.
A escolha dos métodos não deve se basear em como você interpreta a estatística. Se fosse esse o caso, não haveria diferença entre OLS, LAD, Tobit, Heckit, IV, 2SLS ou uma série de outros métodos de regressão.Em vez disso, deve se basear na forma que você acredita que o modelo subjacente que está tentando estimar assume.
Comentários
- -1 Modelos logísticos (mistos) pode certamente modelar taxas de sobrevivência ao longo do tempo. Ver, por exemplo, Allison, P. D. (1982). Métodos de tempo discreto para a análise de históricos de eventos . Sociological Methodology , 13 (1982), 61-98, ou Allison, P. D. (1984). Análise do histórico de eventos: regressão para dados longitudinais de eventos (Vol. 12). Sage Beverly Hills, CA.