Minulla on 100 50×50-korrelaatiomatriisia, jotka minulla on kaikki Fisher z -muunnettu. Ymmärsin, että tämä johtaa siihen, että kaikki yksi matriisin merkinnät jakautuvat likimäärin normaalisti.
Kysymykset
-
Nyt luin jostakin, että tämä tarkoittaa myös sitä, että jos otamme jonkin merkinnän (i, j) kaikki matriisit (joten esimerkiksi matriisin1, matriisin2, …, matriisin100 merkintä (5, 12)), nämä arvot ovat myös normaalisti jakautuneet. Onko tämä totta, ja jos on, niin miksi?
-
Haluan luokitella nämä 100 matriisia kahteen ryhmään. Luokittelussa oletetaan, että kunkin ryhmän tiedot ovat normaalisti jaettuja. Tarkoittaako Fisherin z-muunnos sitä? Vaihtoehtoisesti merkitsisikö se, että kukin merkintä (i, j), $ 1 \ le i \ le 200 $, $ 1 \ le j \ le 200 $, kaikista normaalisti jaetuista matriiseista, että kunkin ryhmän matriisit ovat normaalisti jakautuneet?
vastaus
Fisherin z-muunnos ei takaa normaali jakauma; et erityisesti sisällä korrelaatiomatriisia, joka käyttää eri muuttujia.
- kukin 50 syötemuuttujasta $ X_1 … X_ {50} $ täytyy olla normaalisti jaettu
- jos toistuvasti piirrät näytteitä kahdesta muuttujasta $ i $ ja $ j $ samasta jakaumasta: $ Y_i \ sim X_i $ ja $ Y_j \ sim X_j $ näistä jakaumista, muunnetut korrelaatiokertoimet $ \ {f_z (\ rho_ {ij}) \} $ jakautuvat likimain normaalisti.
Joten jos 100 korrelaatiomatriisisi ovat peräisin samasta jakaumasta (eikä se ole muuttunut niiden välillä), jokaisen solun arvojen tulisi olla suunnilleen normaalijakautuneet. Jos sinulla on kuitenkin kaksi luokkaa, tämä oletus todennäköisesti ei pidä paikkaansa, ja merkintää ei enää jaeta normaalisti.
Tärkeintä on, että tarvitset monia sarjaa näytteitä, jotka on otettu samasta jakelusta. Fisher-muunnoksen tarkoituksena on arvioida korrelaatiokertoimen iv luottamusvälit . Koska (muuntamaton) korrelaatiokerrointa rajoittaa $ -1 … + 1 $, sitä ei voida normaalisti jakaa; mutta Fisherin muunnosta käyttämällä voit silti käyttää tunnettuja tilastoja normaalijakaumiin.
Oletetaan, että haluat arvioida korkeuden ja painon korrelaation (olettaen, että molemmat jakautuvat normaalisti!) . Voit ottaa yhden näytteen ja laskea korrelaation – mutta kuinka suuret ovat virhepiirisi korrelaatiossa? Sen sijaan voit ottaa 100 riippumatonta näytettä, joista kukin laskee sen korrelaation, Fisher muuntaa korrelaation, arvioi normaalit jakautumisvirheet ja muuntaa nämä takaisin. Sitten saat kahden muuttujan keskimääräisen korrelaation ja luottamusväli.
Kommentit
- Kiitos! Joten matriisien rivit ja sarakkeet (jotka ovat tietysti samat) jakautuvat normaalisti yhdessä – tästä seuraa ensimmäinen kohta, jonka X1, .., X50 ovat (marginaalisesti) normaalit. Ymmärränkö toisen huomautuksenne oikein: Jos otan sanan X_1: stä ja X_10: stä, vaikka nämä olisivatkin kaksi normaalijakaumaa, joilla on erilaiset parametrit, (toistuvasti) otetut tiedot olisivat noin. normaali? Jos kuitenkin eri matriiseilla X_1 ja X_10 on erilaiset normaalijakaumat, tämä ei pidä paikkaansa (?). Thx!
- Todellakin. Se ' on kirjaimellisesti sama kuin piirustus erilaisista normaalijakaumista. Jos minulla on normaali jakauma, joka liikkuu ajan myötä ja otan näytteitä eri ajankohdista, saadut kokonaistiedot ' eivät välttämättä ole normaalijakaumia.
- Minulla on toinen asiaan liittyvä kysymys: Jos tiedän, että kaikkien 100 matriisin X_i: n, X_j: n näytteet (i, j) jakautuvat likimäärin normaalisti – tarkoittako tämä, että kaikkien näiden 100 X_i, X_j noudattavat samaa (normaalia) jakelu?
- Ei. Kaikki korrelaatiot voisivat olla normaalijakautuneet nollan ympärille, ts. Eivät korreloivat keskimäärin