これは初心者の質問ですが、6.012のexp(B)の結果をどのように解釈しますか。多項ロジスティック回帰モデルでは?

1)それは6.012-1.0 = 5.012 =リスクの5012%の増加ですか?

または

2)6.012 /( 1 + 6.012)= 0.857 =リスクが85.7%増加しますか?

両方の選択肢が正しくない場合、誰かが正しい方法について言及できますか?

インターネットで多くのリソースを検索し、私はこれらの2つの選択肢にたどり着きましたが、どちらが正しいか完全にはわかりません。

回答

そこにたどり着くまでの間、しかし要約すると、 Bに対応する変数の1単位の変更は、結果の相対リスク(基本結果と比較して)に6.012を掛けます。

これは、相対リスクの「5012%」の増加として表現されるかもしれませんが、それは混乱を招き、可能性があります。実際には多項ロジスティックモデルが乗法的に考えることを強く奨励しているのに、変化を加法的に考える必要があることを示唆しているため、最初は誤解を招く方法です。変数の変更は、問題の結果だけでなく、すべての結果の予測確率を同時に変更するため、修飾子「relative」は不可欠です。したがって、確率を比較する必要があります(を使用) >比率、違いではありません。

この返信の残りの部分では、これらのステートメントを正しく解釈するために必要な用語と直感を開発します。

背景

多項の場合に移る前に、通常のロジスティック回帰から始めましょう。

従属(バイナリ)変数$ Y $と独立変数$ X_i $の場合、モデルは

$です。 $ \ Pr [Y = 1] = \ frac {\ exp(\ beta_1 X_1 + \ cdots + \ beta_m X_m)} {1+ \ exp(\ beta_1 X_1 + \ cdots + \ beta_m X_m)}; $$

同等に、$ 0 \ ne \ Pr [Y = 1] \ ne 1 $と仮定すると、

$$ \ log(\ rho(X_1、\ cdots、X_m))= \ log \ frac {\ Pr [Y = 1]} {\ Pr [Y = 0]} = \ beta_1 X_1 + \ cdots + \ beta_mX_m。$$

(これは単に$ \ rho $を定義します。は$ X_i $の関数としてのオッズです。)

一般性を失うことなく、 x $ X_i $で、$ X_m $が変数で、$ \ beta_m $が質問の「B」になるようにします(したがって、$ \ exp(\ beta_m)= 6.012 $)。 $ X_i、1 \ le i \ lt m $の値を修正し、$ X_m $を少しずつ変化させると$ \ delta $が得られます

$$ \ log(\ rho(\ cdots、X_m + \ delta))-\ log(\ rho(\ cdots、X_m))= \ beta_m \ delta。$$

したがって、$ \ beta_m $ は、に関する対数オッズのわずかな変化です。 $ X_m $。

$ \ exp(\ beta_m)$を回復するには、明らかに$ \ delta = 1 $を設定し、左側を指数化する必要があります。

$$ \ eqalign {\ exp(\ beta_m)& = \ exp(\ beta_m \ times 1)\\ & = \ exp (\ log(\ rho(\ cdots、X_m + 1))-\ log(\ rho(\ cdots、X_m)))\\ & = \ frac {\ rho( \ cdots、X_m + 1)} {\ rho(\ cdots、X_m)}。 } $$

これは、$ X_m $の1単位の増加に対するオッズ比として$ \ exp(\ beta_m)$を示します。これが何を意味するのかを直感的に理解するには、開始オッズの範囲の値を表にして、パターンを目立たせるために大きく丸めます。

Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1] 0.0001 0.0006 0.0001 0.0006 0.001 0.006 0.001 0.006 0.01 0.06 0.01 0.057 0.1 0.6 0.091 0.38 1. 6. 0.5 0.9 10. 60. 0.91 1. 100. 600. 0.99 1. 

< 本当に小さい確率に対応する本当に小さいオッズ、$ X_m $の1単位の増加の効果は、オッズまたは確率を乗算することです。約6.012までに。乗法係数は、オッズ(および確率)が大きくなるにつれて減少し、オッズが10を超えると(確率が0.9を超えると)本質的に消滅します。

確率の比率の変化

加法の変化として、大きな違いはありません0.0001と0.0006の確率の間(0.05%のみ)、0.99と1の間に大きな違いはありません(1%のみ)。最大の相加効果は、オッズが$ 1 / \ sqrt {6.012} \ sim 0.408 $に等しい場合に発生します。ここで、確率は29%から71%に変化します:+ 42%の変化。

確率の加法変化

次に、「リスク」をオッズ比として表すと、$ \ beta_m $ = “B”は単純な解釈になります-オッズ比は、$ X_m $の単位増加に対して$ \ beta_m $に等しくなりますが、確率の変化など、他の方法でリスクを表現する場合、解釈には開始確率を指定するように注意する必要があります。

多項ロジスティック回帰

(これは後の編集として追加されました。)

確率を表すためにログオッズを使用することの価値を認識したら、 “は多項の場合に移ります。これで、従属変数$ Y $は、$ i = 1、2、\ ldots、k $でインデックス付けされた$ k \ ge 2 $カテゴリの1つに等しくなります。相対カテゴリ$ i $に含まれる確率は

$$ \ Pr [Y_i] \ sim \ exp \ left(\ beta_1 ^ {(i)} X_1 + \ cdots + \ beta_m ^ { (i)} X_m \ right)$ $

パラメータ$ \ beta_j ^ {(i)} $を決定し、$ \ Pr [Y = \ text {category} i] $に$ Y_i $を書き込みます。省略形として、右辺の式を$ p_i(X、\ beta)$として記述します。または、$ X $と$ \ beta $がコンテキストから明らかな場合は、単に$ p_i $と記述します。これらすべてを作成するために正規化する相対確率の合計を1にすると、

$$ \ Pr [Y_i] = \ frac {p_i(X、\ beta)} {p_1(X、\ beta)+ \ cdots + p_m(X、\ beta) )}。$$

(パラメータにはあいまいさがあります。パラメータが多すぎます。従来は、比較のために「ベース」カテゴリを選択し、そのすべての係数を強制的にゼロにします。ただし、これはベータの一意の推定値を報告するために必要ですが、係数を解釈する必要はありません 対称性を維持するため、つまりカテゴリ間の人為的な区別を避けるために、必要がない限り、このような制約を適用しないでください。)

このモデルを解釈する1つの方法は、任意のカテゴリ(たとえばカテゴリ$ i $)のログオッズの限界変化率を求めることです。独立変数のいずれか(たとえば$ X_j $)。つまり、$ X_j $を少し変更すると、$ Y_i $の対数オッズが変化します。これら2つの変化に関連する比例定数に関心があります。微積分の連鎖律は、小さな代数とともに、この変化率が

$$ \ frac {\ partial \ \ text {log odds}(Y_i)} {\ partial \ X_j}であることを示しています。 = \ beta_j ^ {(i)}-\ frac {\ beta_j ^ {(1)} p_1 + \ cdots + \ beta_j ^ {(i-1)} p_ {i-1} + \ beta_j ^ {(i + 1)} p_ {i + 1} + \ cdots + \ beta_j ^ {(k)} p_k} {p_1 + \ cdots + p_ {i-1} + p_ {i + 1} + \ cdots + p_k}。$ $

これは、$ Y $がカテゴリ$ i $から “を引いたものである可能性の式の$ X_j $の係数$ \ beta_j ^ {(i)} $として比較的単純な解釈になります。調整。”調整は、他のすべてのカテゴリの$ X_j $の係数の確率加重平均です。重みは、独立変数$ X $の現在の値に関連付けられた確率を使用して計算されます。したがって、ログのわずかな変化は必ずしも一定ではありません。問題のカテゴリ(カテゴリ$ i $)の確率だけでなく、他のすべてのカテゴリの確率に依存します。

$ k = 2 $カテゴリ、これは通常のロジスティック回帰に還元されるはずです。実際、確率の重み付けは何も行わず、($ i = 2 $を選択すると)単純に差$ \ beta_j ^ {(2)}-\ beta_j ^ {(1)} $が得られます。カテゴリ$ i $を基本ケースとすると、$ \ beta_j ^ {(1)} = 0 $を強制するため、これはさらに$ \ beta_j ^ {(2)} $に減少します。したがって、新しい解釈は古い解釈を一般化します。

$ \ beta_j ^ {(i)} $を直接解釈するには、前の式の片側でそれを分離し、次のようにします。

カテゴリ$ i $の$ X_j $の係数は、変数$ X_j $に関するカテゴリ$ i $のログオッズのわずかな変化に等しくなります。プラスカテゴリ$ i $の他のすべての$ X_ {j “} $の係数の確率加重平均。

別の解釈は、少し直接的ではありませんが、(一時的に)カテゴリ$ i $を基本ケースとして設定し、それによってすべての独立変数$ X_j $に対して$ \ beta_j ^ {(i)} = 0 $を作成することによって提供されます。

変数$ X_j $のベースケースのロジットオッズの限界変化率は、すべての係数の確率加重平均の負の値です。その他の場合。

これらの解釈を実際に使用するには、通常、ベータ値と、ソフトウェア出力からの確率と、示されているように計算を実行します。

最後に、指数化された係数について、2つの結果間の確率の比率($ i $の「相対リスク」と呼ばれることもあります)に注意してください。 to $ i “$)is

$$ \ frac {Y_ {i}} {Y_ {i”}} = \ frac {p_ {i}(X、\ beta)} {p_ {i “}(X、\ beta)}。$$

$ X_j $を1単位増やして$ X_j + 1 $にします。これにより、$ p_ {i} $に$ \ exp(\ beta_j ^ {(i)})$が乗算され、$ p_ {i “} $に$ \ exp(\ beta_j ^ {(i”)})$が乗算されます。相対リスクに$ \ exp(\ beta_j ^ {(i)})/ \ exp(\ beta_j ^ {(i “)})$ = $ \ exp(\ beta_j ^ {(i)}-\ beta_j ^ {(i “)})$。カテゴリ$ i “$をベースケースとすると、これは$ \ exp(\ beta_j ^ {(i)})$になり、次のようになります。

指数係数$ \ exp(\ beta_j ^ {(i)})$は、相対リスク$ \ Pr [Y = \ text {category} i] / \ Pr [Y = \ text {の量です。基本カテゴリ}] $は、変数$ X_j $が1単位増えると乗算されます。

コメント

  • すばらしい説明ですが、OPは明示的に多項モデルを要求しました。OPが意図したよりも多くの質問を読んでいる可能性があり、バイナリの場合の説明で十分かもしれませんが、この答えが一般的な多項の場合もカバーするのを見るのが大好きです。パラメータ化は似ていますが、" log-odds "は一般に(任意の)参照カテゴリに関するものであり、は実際には対数オッズではなく、$ X_i $の単位を変更すると、これらの" log-odds "が組み合わされて変更されます。 " log-odds "の増加は、確率の増加を意味するものではありません。
  • @NRH That 'は優れた点です。 "多項分布の代わりに"多変量"を読んだことがあります。"これに戻る機会があれば、それらの詳細を具体化しようとします。幸い、同じ分析モードが正しい解釈を見つけるのに効果的です。
  • @NRH完了。解釈をより明確にする方法、または別の解釈についての提案(または他の誰か')を歓迎します。
  • これを書き留めてくれてありがとう。完全な答えは非常に良い参考資料です。

答え

何に加えて、このちょっとした説明も考慮してみてください@whuberはすでにとてもよく書いています。 exp(B)= 6の場合、問題の予測子の1の増加に関連するオッズ比は6です。多項の文脈では、「オッズ比」とは、次の2つの量の比を意味します。a)オッズ(確率ではなく、p / [1-p])問題の出力テーブルに示されている従属変数の値をとるケースのオッズ、およびb)従属変数の参照値をとるケースのオッズ。

あなたは、ケースがいずれかのカテゴリに属する確率を(オッズではなく)定量化しようとしているようです。これを行うには、ケースが「開始」した確率を知る必要があります。つまり、問題の予測子で1の増加を想定する前にです。確率の比率はケースバイケースで異なりますが、予測子の1の増加に関連するオッズ比は同じままです。

コメント

  • " exp(B)= 6の場合、問題の予測子の1の増加に関連するオッズ比は6 "、 @whuber 'の回答を正しく読んだ場合、オッズ比は倍になり、予測子で1が増加すると表示されます。つまり、新しいオッズ比は6になりません。それとも、間違って解釈しているのでしょうか?
  • "新しいオッズ比は6になりません"私は"新しいオッズは6になりません…ただし、新しいオッズと古いオッズの比率は6になります。"
  • はい、同意します。しかし、"問題の予測子の1の増加に関連するオッズ比は6であると思っただけです"は実際にはそれを言っていません。しかし、多分私はそれを誤解しているだけです。説明してくれてありがとう!

回答

私も同じ答えを探していましたが、上記の1つは私には満足できません。それが実際に何であるかについては複雑に見えました。だから私は私の解釈を与えます、私が間違っているなら私を訂正してください。

しかしそれは重要なので最後まで読んでください。

まず最初に値BとExp( B)あなたが探しているのは一度です。 Bが負の場合、Exp(B)は1より低くなります。これは、オッズが減少することを意味します。 Exp(B)が1より高い場合、オッズが増加することを意味します。係数Exp(B)を掛けているので。

残念ながら、まだそこにはいません。多項回帰では、従属変数に複数のカテゴリがあるため、これらのカテゴリをD1、D2、D3と呼びましょう。最後のカテゴリは参照カテゴリです。最初の独立変数は性別(男性と女性)であると仮定します。

D1->男性の出力がexp(B)= 1.21であるとしましょう。これは、男性の場合、D3(参照カテゴリ)ではなくカテゴリD1に属する確率が1.21倍増加することを意味します。女性(参照カテゴリ)と比較します。

したがって、従属変数だけでなく独立変数の参照カテゴリと常に比較しています。これは、共変量変数がある場合は当てはまりません。その場合は、次のことを意味します。 Xが1単位増加すると、D3ではなくカテゴリD1に含まれる確率が1.21倍になります。

順序従属変数がある場合:

順序変数がある場合従属変数であり、たとえば比例オッズの仮定のために順序回帰を実行しませんでした。最高値を覚えておいてください。 categoryは参照カテゴリです。上記の結果は報告に有効です。ただし、実際よりもオッズが増加すると、上位ではなく下位のカテゴリに属するオッズが増加することに注意してください。ただし、これは、序数の従属変数がある場合のみです。

パーセンテージの増加を知りたい場合は、架空のオッズ数を取得します。たとえば、100を掛けて、1.21を掛けます。 121? 100と比較して、パーセンテージでどの程度変化しましたか?

回答

mlogitのexp(b)が1.04であるとします。 数値に1.04を掛けると、4%増加します。 これは、bではなくaのカテゴリーに入る相対リスクです。 ここでの混乱の一部は、4%(乗法の意味)と4%ポイント(加法の意味)に関係しているのではないかと思います。 パーセンテージポイントの変化ではなく、パーセンテージの変化について話す場合、%の解釈は正しいです。 (後者は、相対リスクがパーセンテージで表されていないため、とにかく意味がありません。)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です