100個の50×50相関行列があり、すべてのフィッシャーのz変換があります。これにより、 1つの行列のすべてのエントリがほぼ正規分布することを理解しました。
質問
-
どこかで読んだのですが、これは、すべてのエントリ(i、j)を取得した場合も意味します。行列(たとえば、matrix1、matrix2、…、matrix100のエントリ(5、12)の場合)、これらの値も正規分布しています。これは本当ですか?もしそうなら-なぜですか?
-
これらの100個の行列を2つのグループに分類したいと思います。分類は、各グループのデータが正規分布していることを前提としています。フィッシャーのz変換はそれを意味しますか?あるいは、すべての行列からの各エントリ(i、j)、$ 1 \ le i \ le 200 $、$ 1 \ le j \ le 200 $が正規分布しているという事実は、各グループの行列が正規分布していることを意味しますか?
回答
フィッシャーのz変換は保証しません正規分布;特に、異なる変数を使用する相関行列の内ではありません。
- 50個の入力変数のそれぞれ$ X_1 … X_ {50} $は正規分布する必要があります
- 同じ分布から2つの変数$ i $と$ j $からサンプルを繰り返し描画する場合:$ Y_i \これらの分布からsimX_i $と$ Y_j \ sim X_j $が得られると、変換された相関係数$ \ {f_z(\ rho_ {ij})\} $はほぼ正規分布になります。
したがって、100個の相関行列が同じ分布に由来する場合(そしてその間に変化していない場合)、各セルの値はほぼ正規分布している必要があります。ただし、2つのクラスがある場合、この仮定はおそらく成り立たず、エントリは正規分布されなくなります。
重要な点は、多くのクラスが必要であるということです。 同じ分布から抽出されたサンプルのセット。フィッシャー変換の目的は、相関係数の信頼区間を推定することです。 (変換されていない)相関係数は$ -1 … + 1 $によって制限されるため、正規分布することはできません。ただし、Fisher変換を使用すると、正規分布の既知の統計を使用できます。
したがって、身長と体重の相関を推定するとします(両方が正規分布していると仮定します)。 。単一のサンプルを取得して相関を計算できますが、相関の誤差範囲はどのくらいですか?代わりに、100個の独立したサンプルを取得し、それぞれについて相関を計算し、フィッシャーが相関を変換し、正規分布誤差を推定して、これらを元に戻すことができます。次に、2つの変数の平均相関を 信頼区間で取得できます。
コメント
- ありがとうございます。したがって、行列の行と列(明らかに同じ)は、一緒に正規分布します。したがって、X1、..、X50が(わずかに)正規であるという最初のポイントが続きます。 2番目のポイントを正しく理解していますか:X_1とX_10からサンプルを取得した場合、これらが異なるパラメーターを持つ2つの正規分布であっても、(繰り返し)サンプリングされたデータは約です。正常?ただし、異なる行列のX_1とX_10の正規分布が異なる場合、これは当てはまりません(?)。 Thx!
- 確かに。 'は、さまざまな正規分布から描画するのと文字通り同じです。時間の経過とともに移動する正規分布があり、さまざまな時点でサンプリングした場合、結果の全体的なデータは必ずしも正規分布ではありません'。
- 別の関連する質問があります:100個の行列すべてのX_i、X_jからのサンプル(i、j)がほぼ正規分布していることがわかっている場合、これら100個すべてのX_i、X_jが同じ(正規)に従うことを意味しますか?配布?
- いいえ。すべての相関は、0付近に正規分布している可能性があります。つまり、平均して相関していない可能性があります。