En régression logistique, un odds ratio de 2 signifie que lévénement est 2 fois plus probable compte tenu dune augmentation dune unité du prédicteur. Dans la régression de Cox, un rapport de risque de 2 signifie que lévénement se produira deux fois plus souvent à chaque instant, étant donné une augmentation dune unité du prédicteur. Nest-ce pas pratiquement la même chose?
Quel est donc lavantage de faire une régression de Cox et dobtenir des rapports de risque si nous pouvons obtenir fonctionnellement les mêmes informations à partir des rapports de cotes de la régression logistique?
Réponse
un rapport de cotes de 2 signifie que lévénement est 2 fois plus probable compte tenu dun augmentation dune unité du prédicteur
Cela signifie que les chances doubleraient, ce qui nest pas la même chose que la probabilité de doubler.
Dans la régression de Cox, un rapport de risque de 2 signifie que lévénement se produira deux fois plus souvent à chaque instant étant donné une augmentation dune unité du prédicteur.
Mis à part un peu de handwaving, oui – le taux doccurrence double. Cest comme une probabilité instantanée mise à léchelle.
Ne sagit-il pas pratiquement de la même chose?
Cest presque la même chose quand doubler les chances de lévénement revient presque au même que doubler le risque de lévénement. Ils « ne sont pas automatiquement similaires, mais dans certaines circonstances (assez courantes), ils peuvent correspondre très étroitement.
Vous voudrez peut-être examiner plus attentivement la différence entre les cotes et les probabilités.
Voir , par exemple, la première phrase ici , qui indique clairement que les cotes sont le rapport dune probabilité à son complément. Par exemple, augmenter les cotes (en favor) de 1 à 2 équivaut à augmenter la probabilité de $ \ frac {1} {2} $ à $ \ frac {2} {3} $ . Les cotes augmentent plus vite que la probabilité augmente. Pour de très petites probabilités, les cotes en faveur et la probabilité sont très similaires, tandis que les cotes contre deviennent de plus en plus similaires à (dans le sens où le ratio ira à 1) linverse de la probabilité à mesure que la probabilité diminue. Un rapport de cotes est simplement le rapport de deux ensembles de cotes. Augmenter le rapport de cotes tout en maintenant une constante de cotes de base correspond à augmenter lautre les probabilités, mais peuvent ou non être similaires au changement relatif de probabilité.
Vous voudrez peut-être aussi réfléchir à la différence entre le danger et la probabilité (voir ma discussion précédente où je fais mention de la main-agitant; maintenant nous ne passons pas sous silence la différence). Par exemple, si une probabilité est de 0,6, vous ne pouvez pas la doubler – mais un risque instantané de 0,6 peut être doublé à 1,2. Ils « ne sont pas la même chose, de la même manière que la densité de probabilité nest pas la probabilité.
Commentaires
- +1 Juste commenter pour mentionner que certains les formes danalyse de lhistorique des événements utilisent une définition différente de la fonction de risque (par exemple, $ h (t) $ dans les modèles dhistorique des événements à temps discret est la probabilité quun événement se produise au temps $ t $ à condition quil ne se soit pas produit avant ce moment , et en tant que tel $ 2 \ fois 0,6 $ naurait aucun sens dans de tels modèles).
- Merci, que ' est tout à fait pertinent. Ceci est lié au fait quun pmf discret peut ' t nimporte où dépasser 1 alors quune densité le peut certainement.
Réponse
Cest une bonne question. Mais ce que vous demandez vraiment ne devrait pas être comment la statistique est interprétée, mais quelles hypothèses sous-tendent chacun de vos modèles respectifs (aléa ou logistique). Un modèle logistique est un modèle statique qui prédit efficacement le li la probabilité quun événement se produise à un moment donné compte tenu des informations observables. Cependant, un modèle de risque ou modèle de Cox est un modèle de durée qui modélise les taux de survie dans le temps. Vous pourriez poser une question comme « quelle est la probabilité quun consommateur de cigarette survive jusquà lâge de 75 ans par rapport à celle dun non-utilisateur avec votre régression logistique » (étant donné que vous avez des informations sur la mortalité pour une cohorte jusquà 75 ans) . Mais si à la place vous voulez profiter de la plénitude de la dimension temporelle de vos données, alors utiliser un modèle de risque sera plus approprié.
En fin de compte, cela dépend vraiment de ce que vous voulez modéliser. Pensez-vous que ce que vous modélisez est un événement ponctuel? Utilisez la logistique. Si vous pensez que votre événement a une chance fixe ou proportionnelle de se produire à chaque période sur un spectre temporel observable? Utilisez un modèle de risque.
Le choix des méthodes ne doit pas être basé sur la façon dont vous interprétez la statistique. Si tel était le cas, il ny aurait aucune différence entre les méthodes OLS, LAD, Tobit, Heckit, IV, 2SLS ou une foule dautres méthodes de régression.Il devrait plutôt être basé sur la forme que vous pensez que prend le modèle sous-jacent que vous essayez destimer.
Commentaires
- -1 (Mixed) peut certainement modéliser les taux de survie dans le temps. Voir par exemple Allison, P. D. (1982). Méthodes en temps discret pour lanalyse des historiques dévénements . Sociological Methodology , 13 (1982), 61–98, ou Allison, P. D. (1984). Analyse de lhistorique des événements: régression pour les données dévénements longitudinales (Vol. 12). Sage Beverly Hills, Californie.