W regresji logistycznej iloraz szans równy 2 oznacza, że zdarzenie jest 2 razy bardziej prawdopodobne, biorąc pod uwagę wzrost predyktora o jedną jednostkę. W regresji Coxa współczynnik ryzyka wynoszący 2 oznacza, że zdarzenie będzie występować dwa razy częściej w każdym punkcie czasowym przy wzroście predyktora o jedną jednostkę. Czy to w zasadzie nie to samo?
Jaka jest zatem korzyść z wykonywania regresji Coxa i uzyskiwania współczynników hazardu, jeśli możemy uzyskać funkcjonalnie te same informacje z ilorazów szans regresji logistycznej?
Odpowiedź
iloraz szans 2 oznacza, że zdarzenie jest 2 razy bardziej prawdopodobne, biorąc pod uwagę wzrost o jedną jednostkę w predyktorze
Oznacza to, że kursy podwoją się, co nie jest tym samym, co podwojenie prawdopodobieństwa.
W regresji Coxa współczynnik ryzyka wynoszący 2 oznacza, że zdarzenie będzie występować dwa razy częściej w każdym punkcie czasowym przy wzroście predyktora o jedną jednostkę.
Poza odrobiną machania ręką, tak – częstotliwość występowania podwaja się. To jest jak skalowane chwilowe prawdopodobieństwo.
Czy to praktycznie nie to samo?
To prawie to samo, gdy podwojenie szans na wydarzenie jest prawie tym samym, co podwojenie ryzyka wydarzenia. Nie są one automatycznie podobne, ale w pewnych (dość powszechnych) okolicznościach mogą one bardzo blisko ze sobą korespondować.
Możesz dokładniej rozważyć różnicę między kursami a prawdopodobieństwem.
Zobacz na przykład pierwsze zdanie tutaj , z którego jasno wynika, że szanse są stosunkiem prawdopodobieństwa do jego uzupełnienia. Na przykład zwiększenie szans (w korzyść) z 1 do 2 to to samo, co prawdopodobieństwo wzrostu z $ \ frac {1} {2} $ do $ \ frac {2} {3} $ . Szanse rosną szybciej niż prawdopodobieństwo. W przypadku bardzo małych prawdopodobieństw szanse na korzyść i prawdopodobieństwo są bardzo podobne, podczas gdy szanse na przeciw stają się coraz bardziej podobne do (w tym sensie, że iloraz szans wyniesie 1) odwrotności prawdopodobieństwa, gdy prawdopodobieństwo maleje. Iloraz szans to po prostu stosunek dwóch zestawów kursów. Zwiększenie ilorazu szans przy jednoczesnym utrzymaniu podstawowej stałej szansy odpowiada zwiększeniu drugiego szanse, ale mogą być podobne do względnej zmiany prawdopodobieństwa lub nie.
Możesz także rozważyć różnicę między zagrożeniem a prawdopodobieństwem (zobacz moją wcześniejszą dyskusję, w której wspominam o machaniu ręką; teraz nie pomijamy różnicy). Na przykład, jeśli prawdopodobieństwo wynosi 0,6, nie można go podwoić – ale chwilowe zagrożenie z 0,6 można podwoić do 1,2. To nie to samo, w ten sam sposób, w jaki gęstość prawdopodobieństwa nie jest prawdopodobieństwem.
Komentarze
- +1 Tylko komentując, wspomnę, że niektórzy formy analizy historii zdarzeń wykorzystują inną definicję funkcji hazardu (np. $ h (t) $ w dyskretnych modelach historii zdarzeń to prawdopodobieństwo wystąpienia zdarzenia w czasie $ t $ uwarunkowane tym, że nie wystąpiło przed tym czasem , i jako takie $ 2 \ times 0.6 $ nie miałoby sensu w takich modelach).
- Dzięki, że ' jest zdecydowanie istotne. Wiąże się to z faktem że dyskretne pmf nie może ' nigdzie przekraczać 1, podczas gdy gęstość zdecydowanie nie.
Odpowiedź
To dobre pytanie. Ale tak naprawdę nie chodzi o to, jak interpretowana jest statystyka, ale jakie założenia leżą u podstaw każdego z modeli (hazardowych lub logistycznych). Model logistyczny to model statyczny który skutecznie przewiduje li prawdopodobieństwo zaistnienia zdarzenia w określonym czasie na podstawie możliwych do zaobserwowania informacji. Jednak model ryzyka lub model Coxa to model czasu trwania, który modeluje współczynniki przeżycia w czasie. Możesz zadać pytanie typu „jakie jest prawdopodobieństwo, że użytkownik papierosa przeżyje do 75 roku życia w porównaniu z tym, który nie korzysta z Twojej regresji logistycznej” (biorąc pod uwagę, że masz informacje o śmiertelności w kohorcie do 75 roku życia) . Ale jeśli zamiast tego chcesz wykorzystać pełnię wymiaru czasowego swoich danych, bardziej odpowiednie będzie użycie modelu hazardu.
Ostatecznie jednak sprowadza się to do tego, co chcesz modelować. Czy uważasz, że to, co modelujesz, jest jednorazowym wydarzeniem? Użyj logistyki. Jeśli uważasz, że twoje wydarzenie ma stałą lub proporcjonalną szansę wystąpienia w każdym okresie w obserwowalnym spektrum czasowym? Użyj modelu zagrożeń.
Wybór metod nie powinien opierać się na tym, jak interpretujesz statystyki. Gdyby tak było, nie byłoby różnicy między OLS, LAD, Tobit, Heckit, IV, 2SLS lub wieloma innymi metodami regresji.Zamiast tego powinno się opierać na tym, jaką formę według Ciebie przyjmuje model bazowy, który próbujesz oszacować.
Komentarze
- -1 (mieszane) Modele logistyczne może z pewnością modelować wskaźniki przeżycia w czasie. Patrz na przykład Allison, P. D. (1982). Metody dyskretne do analizy historii zdarzeń . Sociological Methodology , 13 (1982), 61–98 lub Allison, P. D. (1984). Analiza historii zdarzeń: regresja dla danych zdarzeń podłużnych (tom 12). Sage Beverly Hills, Kalifornia.