Bei der logistischen Regression bedeutet ein Odds Ratio von 2, dass das Ereignis bei einer Erhöhung des Prädiktors um eine Einheit 2-mal wahrscheinlicher ist. Bei der Cox-Regression bedeutet eine Hazard Ratio von 2, dass das Ereignis zu jedem Zeitpunkt doppelt so häufig auftritt, wenn der Prädiktor um eine Einheit erhöht wird. Sind diese nicht praktisch dasselbe?

Was ist dann der Vorteil einer Cox-Regression und des Erhaltens von Hazard Ratios, wenn wir funktional die gleichen Informationen aus den Odds Ratios der logistischen Regression erhalten können?

Antwort

Ein Quotenverhältnis von 2 bedeutet, dass das Ereignis bei a 2-mal wahrscheinlicher ist Erhöhung des Prädiktors um eine Einheit

Dies bedeutet, dass sich die Gewinnchancen verdoppeln würden, was nicht der Wahrscheinlichkeit einer Verdoppelung entspricht.

Bei der Cox-Regression bedeutet eine Hazard Ratio von 2, dass das Ereignis zu jedem Zeitpunkt doppelt so häufig auftritt, wenn der Prädiktor um eine Einheit erhöht wird.

Abgesehen von ein wenig Handbewegung, ja – die Häufigkeit des Auftretens verdoppelt sich. Es ist wie eine skalierte augenblickliche Wahrscheinlichkeit.

Sind diese nicht praktisch dasselbe?

Sie sind fast dasselbe, wenn die Verdoppelung der Wahrscheinlichkeit des Ereignisses fast gleich der Verdoppelung der Gefahr des Ereignisses ist. Sie sind nicht automatisch ähnlich, aber unter bestimmten (ziemlich häufigen) Umständen können sie sehr genau übereinstimmen.

Möglicherweise möchten Sie den Unterschied zwischen Gewinnchancen und Wahrscheinlichkeit genauer betrachten.

Siehe Zum Beispiel der erste Satz hier , der deutlich macht, dass Quoten das Verhältnis einer Wahrscheinlichkeit zu ihrem Komplement sind. So erhöhen Sie beispielsweise die Quoten (in favor) von 1 auf 2 entspricht der Wahrscheinlichkeit, die von $ \ frac {1} {2} $ auf $ \ steigt frac {2} {3} $ . Die Gewinnchancen steigen schneller als die Wahrscheinlichkeit. Bei sehr kleinen Wahrscheinlichkeiten sind die Gewinnchancen und die Wahrscheinlichkeit sehr ähnlich, während die Gewinnchancen (in dem Sinne, dass die Das Verhältnis geht zu 1) Kehrwerte der Wahrscheinlichkeit, wenn die Wahrscheinlichkeit klein wird. Ein Quotenverhältnis ist einfach das Verhältnis zweier Sätze von Quoten. Das Erhöhen des Quotenverhältnisses bei konstanter Basisquote entspricht dem Erhöhen des anderen Quoten, können aber der relativen Änderung der Wahrscheinlichkeit ähnlich sein oder auch nicht.

Möglicherweise möchten Sie auch über den Unterschied zwischen Gefahr und Wahrscheinlichkeit nachdenken (siehe meine frühere Diskussion, in der ich das Winken von Hand erwähne; Jetzt beschönigen wir den Unterschied nicht. Wenn beispielsweise eine Wahrscheinlichkeit 0,6 beträgt, können Sie sie nicht verdoppeln – aber eine sofortige Gefahr von 0,6 kann auf 1,2 verdoppelt werden. Sie sind nicht dasselbe, genauso wie die Wahrscheinlichkeitsdichte keine Wahrscheinlichkeit ist.

Kommentare

  • +1 Nur kommentieren, um einige zu erwähnen Formen der Ereignisverlaufsanalyse verwenden eine andere Definition der Gefährdungsfunktion (z. B. $ h (t) $ in zeitdiskreten Ereignisverlaufsmodellen ist die Wahrscheinlichkeit, dass ein Ereignis zum Zeitpunkt $ t $ auftritt, vorausgesetzt, dass es nicht vor diesem Zeitpunkt aufgetreten ist und als solches würde $ 2 \ mal 0,6 $ in solchen Modellen keinen Sinn ergeben).
  • Danke, dass ' definitiv relevant ist. Dies hängt mit der Tatsache zusammen dass eine diskrete pmf ' nirgendwo 1 überschreiten kann, während eine Dichte dies definitiv kann.

Antwort

Dies ist eine gute Frage. Was Sie jedoch wirklich fragen, sollte nicht sein, wie die Statistik interpretiert wird, sondern welche Annahmen jedem Ihrer jeweiligen Modelle zugrunde liegen (Gefahr oder Logistik). Ein Logistikmodell ist ein statisches Modell was effektiv vorhersagt, die li Existenz eines Ereignisses zu einem bestimmten Zeitpunkt bei beobachtbaren Informationen. Ein Gefährdungsmodell oder Cox-Modell ist jedoch ein Dauer-Modell, das die Überlebensraten über die Zeit modelliert. Sie könnten eine Frage stellen wie „Wie hoch ist die Wahrscheinlichkeit, dass ein Zigarettenkonsument mit Ihrer logistischen Regression bis zum Alter von 75 Jahren überlebt, im Vergleich zu der eines Nichtbenutzers mit Ihrer logistischen Regression?“ . Wenn Sie jedoch stattdessen die Fülle der Zeitdimension Ihrer Daten nutzen möchten, ist die Verwendung eines Gefährdungsmodells besser geeignet.

Letztendlich kommt es jedoch wirklich darauf an, was Sie modellieren möchten. Glauben Sie, dass das, was Sie modellieren, ein einmaliges Ereignis ist? Verwenden Sie die Logistik. Wenn Sie glauben, dass Ihr Ereignis eine feste oder proportionale Wahrscheinlichkeit hat, in jedem Zeitraum über ein beobachtbares Zeitspektrum aufzutreten? Verwenden Sie ein Gefährdungsmodell.

Die Auswahl der Methoden sollte nicht davon abhängen, wie Sie die Statistik interpretieren. Wenn dies der Fall wäre, gäbe es keinen Unterschied zwischen OLS, LAD, Tobit, Heckit, IV, 2SLS oder einer Vielzahl anderer Regressionsmethoden.Es sollte stattdessen darauf basieren, welche Form das zugrunde liegende Modell, das Sie schätzen möchten, Ihrer Meinung nach annimmt.

Kommentare

  • -1 (gemischte) Logistikmodelle kann sicherlich Überlebensraten im Laufe der Zeit modellieren. Siehe zum Beispiel Allison, P. D. (1982). Zeitdiskrete Methoden zur Analyse von Ereignisverläufen . Sociological Methodology , 13 (1982), 61–98 oder Allison, P. D. (1984). Ereignisverlaufsanalyse: Regression für longitudinale Ereignisdaten (Band 12). Salbei Beverly Hills, CA.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.