Ich habe 100 50×50-Korrelationsmatrizen, die ich alle Fisher-Z-Transformation habe. Ich habe verstanden, dass dies dazu führt, dass alle Einträge einer one -Matrix ungefähr normal verteilt sind.

Fragen

  • Jetzt habe ich irgendwo gelesen, dass dies auch bedeutet, dass wenn wir einen Eintrag (i, j) von all nehmen Matrizen (so zum Beispiel Eintrag (5, 12) für Matrix1, Matrix2, …, Matrix100), diese Werte sind ebenfalls normalverteilt. Ist das wahr und wenn ja – warum?

  • Ich möchte diese 100 Matrizen in zwei Gruppen einteilen. Bei der Klassifizierung wird davon ausgegangen, dass die Daten aus jeder Gruppe normal verteilt sind. Bedeutet die Fisher-Z-Transformation das? Würde die Tatsache, dass jeder Eintrag (i, j), $ 1 \ le i \ le 200 $, $ 1 \ le j \ le 200 $ von allen normal verteilten Matrizen, alternativ bedeuten, dass die Matrizen jeder Gruppe normal verteilt sind?

Antwort

Die Fisher-Z-Transformation garantiert nicht eine Normalverteilung; insbesondere nicht innerhalb einer Korrelationsmatrix mit verschiedenen Variablen.

  • jede Ihrer 50 Eingabevariablen $ X_1 … X_ {50} $ muss normal
  • verteilt sein
  • , wenn Sie wiederholt Stichproben aus zwei Variablen $ i $ und $ j $ aus denselben Verteilungen ziehen: $ Y_i \ sim X_i $ und $ Y_j \ sim X_j $ aus diesen Verteilungen, dann werden die transformierten Korrelationskoeffizienten $ \ {f_z (\ rho_ {ij}) \} $ ungefähr normal verteilt.

Wenn Ihre 100 Korrelationsmatrizen aus derselben Verteilung stammen (und sich dazwischen nicht geändert haben), sollten die Werte jeder Zelle ungefähr normal verteilt sein. Wenn Sie jedoch zwei Klassen haben, gilt diese Annahme wahrscheinlich nicht und wird nicht mehr normal verteilt.

Der entscheidende Punkt ist, dass Sie viele benötigen Sätze von Stichproben, die aus derselben Verteilung gezogen wurden. Der Zweck der Fisher-Transformation besteht darin, Konfidenzintervalle des Korrelationskoeffizienten zu schätzen. Da der (nicht transformierte) Korrelationskoeffizient durch $ -1 … + 1 $ begrenzt ist, kann er nicht normal verteilt werden. Mit der Fisher-Transformation können Sie jedoch die bekannten Statistiken für Normalverteilungen verwenden.

Nehmen Sie also an, Sie möchten die Korrelation von Größe und Gewicht schätzen (vorausgesetzt, beide sind normalverteilt!). . Sie können eine einzelne Stichprobe nehmen und die Korrelation berechnen – aber wie groß sind Ihre Fehlergrenzen für die Korrelation? Stattdessen können Sie 100 unabhängige Stichproben entnehmen, für die jeweils die Korrelation berechnet wird. Fisher transformiert die Korrelation, schätzt die Normalverteilungsfehler und transformiert diese zurück. Dann können Sie eine durchschnittliche Korrelation der beiden Variablen und eines Konfidenzintervalls erhalten.

Kommentare

  • Danke! Die Zeilen und Spalten der Matrizen (die offensichtlich gleich sind) sind also gemeinsam normalverteilt – daher folgt Ihr erster Punkt, dass X1, .., X50 (geringfügig) normal sind. Verstehe ich Ihren zweiten Punkt richtig: Wenn ich von X_1 und X_10 eine Stichprobe nehme, selbst wenn dies zwei Normalverteilungen mit unterschiedlichen Parametern sind, wären die (wiederholt) abgetasteten Daten ca. normal? Wenn jedoch X_1 und X_10 aus verschiedenen Matrizen unterschiedliche Normalverteilungen haben, gilt dies nicht (?). Danke!
  • In der Tat. ' ist buchstäblich dasselbe wie das Zeichnen aus verschiedenen Normalverteilungen. Wenn ich eine Normalverteilung habe, die sich im Laufe der Zeit bewegt, und zu verschiedenen Zeitpunkten Stichproben mache, sind die resultierenden Gesamtdaten ' nicht unbedingt normalverteilt.
  • Ich habe eine andere verwandte Frage: Wenn ich weiß, dass die Abtastwerte (i, j) von X_i, X_j aller 100 Matrizen ungefähr normal verteilt sind, bedeutet dies, dass X_i, X_j aller dieser 100 Matrizen denselben (normalen) folgen. Verteilung?
  • Nein. Alle Korrelationen könnten normal um 0 verteilt sein, d. H. Im Durchschnitt nicht korreliert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.