100 50×50 korrelációs mátrixom van, amelyeket mind Fisher z-transzformáltam. Megértettem, hogy ez azt eredményezi, hogy az one mátrix összes bejegyzése megközelítőleg normálisan oszlik meg.

Kérdések

  • Most olvastam valahol, hogy ez azt is jelenti, hogy ha az összes beírunk néhány bejegyzést (i, j), mátrixok (így például az (5, 12) bejegyzés a mátrix1, mátrix2, …, mátrix100 esetében), ezek az értékek szintén normálisan vannak elosztva. Ez igaz, és ha igen – miért?

  • Ezt a 100 mátrixot két csoportba szeretném sorolni. A besorolás feltételezi, hogy az egyes csoportok adatai normálisan vannak elosztva. A Fisher z-transzformáció ezt magában foglalja? Alternatív megoldásként az a tény, hogy minden bejegyzés (i, j), $ 1 \ le i \ le 200 $, $ 1 \ le j \ le 200 $, az összes normálisan elosztott mátrixból azt jelentené, hogy az egyes csoportok mátrixai normálisan vannak elosztva?

Válasz

A Fisher z-transzformáció nem garantálja normális eloszlás; különösen nem belül egy olyan korrelációs mátrix, amely különböző változókat használ.

  • mind az 50 beviteli változó $ X_1 … X_ {50} A $ -ot normálisan el kell osztani
  • ha ismételten két mintából veszel két $ i $ és $ j $ változót ugyanazokból a disztribúciókból: $ Y_i \ sim X_i $ és $ Y_j \ sim X_j $ ezekből az eloszlásokból, akkor a $ \ {f_z (\ rho_ {ij}) \} $ transzformált korrelációs együtthatók megközelítőleg normálisan oszlanak majd meg.

Tehát, ha a 100 korrelációs mátrixod az ugyanaz eloszlásból származik (és ez nem változott között), akkor az egyes cellák értékeinek megközelítőleg normálisan kell eloszlaniuk. Ha azonban két osztálya van, akkor ez a feltételezés valószínűleg nem áll fenn, és a bejegyzés nem lesz normálisan elosztva.

A legfontosabb az, hogy sok kell Az azonos eloszlásból vett minták halmazai ból. A Fisher-transzformáció célja a korrelációs együttható megbízhatósági intervallumainak megbecsülése. Mivel a (nem transzformált) korrelációs együtthatót $ -1 … + 1 $ határolja, ezért nem osztható el normálisan; de a Fisher-transzformáció segítségével ennek ellenére felhasználhatja az ismert statisztikákat a normális eloszlásokhoz.

Tehát feltételezzük, hogy meg akarja becsülni a magasság és a súly korrelációját (feltételezve, hogy mindkettő normálisan eloszlik! . Egyetlen mintát vehet, és kiszámíthatja a korrelációt – de mekkora a hibahatára a korreláción? Ehelyett 100 független mintát vehet, mindegyik számára kiszámítja a korrelációját, Fisher átalakítja a korrelációt, megbecsüli a normális eloszlási hibákat és ezeket átalakítja. Ezután megkaphatja a két változó átlagos korrelációját és egy megbízhatósági intervallumot.

Megjegyzések

  • Köszönjük! Tehát a mátrixok sorai és oszlopai (amelyek nyilvánvalóan megegyeznek) közösen oszlanak el normálisan – ezért következik az első pont, amely szerint X1, .., X50 (marginálisan) normális. Helyesen értem-e a második pontját: Ha X_1 és X_10 alapján mondanivalót veszek, akkor is, ha ez két normál eloszlás, különböző paraméterekkel, a (többször) mintavételezett adatok kb. Normál? Ha azonban a különböző mátrixok X_1 és X_10 normális eloszlása eltérő, akkor ez nem igaz (?). Thx!
  • Valóban. ' szó szerint megegyezik a különböző normális eloszlásokból történő rajzolással. Ha normál eloszlásom van, amely az idő múlásával mozog, és különböző időpontokban veszek mintát, akkor a kapott összes adat nem lesz ' nem feltétlenül normális eloszlású.
  • Van még egy kapcsolódó kérdésem: Ha tudom, hogy az összes 100 mátrix X_i, X_j mintái (i, j) megközelítőleg normálisan oszlanak el – ez azt jelenti-e, hogy mind a 100 X_i, X_j ugyanazt követi (normál) terjesztés?
  • Nem. Minden összefüggés normális lehet 0 körül, azaz átlagban nincs korrelációban.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük