Haluan testata näytekorrelaation $ r $ merkitsevyyden p-arvojen avulla, eli

$ H_0: \ rho = 0, \; H_1: \ rho \ neq 0. $

Olen ymmärtänyt, että voin käyttää Fisherin z-muunnosta tämän laskemiseen

$ z_ {obs} = \ displaystyle \ frac {\ sqrt {n-3}} {2} \ ln \ vasen (\ displaystyle \ frac {1 + r} {1-r} \ oikea) $

ja löytää p-arvo

$ p = 2P \ left (Z > z_ {obs} \ right) $

käyttäen normaalia normaalijakaumaa.

Kysymykseni kuuluu: kuinka suuren $ n $: n tulisi olla, jotta tämä olisi sopiva muunnos? Ilmeisesti $ n $: n on oltava suurempi kuin 3. Oppikirjani ei mainitse mitään rajoituksia, mutta tässä esityksessä sanotaan, että $ n $: n on oltava suurempia kuin 10. Harkitakseni tietoja minulla on jotain, kuten $ 5 \ leq n \ leq 10 $.

Kommentit

  • Wikipedia-sivulla luetellaan $ z_ {obs: n vakiovirhe } $, jonka antaa $ 1 / \ sqrt {N-3} $, jossa $ N $ on otoskoko. Joten ’ ll tarvitset vähintään 4 täydellistä paria. I en ole tietoinen rajoituksista, jotka eivät ylitä otoksen kokoa koskevia rajoitteita.
  • Et ole varma, kuinka paljon luottaa esitykseen, joka pystyy ’ t kirjoittavat oman yliopiston nimen. Vakavammin varo kaikkia neuvoja, jotka viittaavat siihen, että asiat ovat kunnossa tietyn otoskokon yläpuolella ja muuten kauhistuttavat. ’ on kysymys likimääräisestä laadusta, joka kasvaa tasaisesti otoksen koon mukaan ja myös tietojen jakautumisen mukaan. Yksinkertainen neuvo on olla hyvin varovainen, piirtää kaikki ja tarkastaa ristiintarkastus bootstrapped-luottamusväleillä.
  • Dia 17 kuvaa t-testin erikoistapaukselle $ \ rho = 0 $.
  • Linkki courses.education.illinois.edu/EdPsy580/lectures/… -esitykseen on nyt rikki ,

vastaus

Tällaisissa kysymyksissä aion vain suorittaa simulaation ja nähdä, onko $ p $ – arvot käyttäytyvät niin kuin odotan. $ P $ -arvo on todennäköisyys piirtää satunnaisesti näyte, joka poikkeaa vähintään yhtä paljon nollahypoteesista kuin havaitsemasi tiedot, jos nollahypoteesi on totta. Joten jos meillä olisi paljon tällaisia näytteitä, ja yhden heistä $ p $ -arvo olisi .04, odotamme, että 4%: lla näistä näytteistä arvo on alle .04. Sama pätee kaikkiin muihin mahdollisiin $ p $ -arvoihin.

Alla on simulaatio Statassa. Kaaviot tarkistavat, mittaavatko $ p $ -arvot sen, mitä niiden on tarkoitus mitata, eli ne osoittavat, kuinka paljon poikkeaa nimellisten $ p $ -arvoja pienempien $ p $ -arvoja sisältävien näytteiden osuus nimellisestä $ p: stä $ -arvo. Kuten näette, testi on jonkin verran ongelmallinen niin pienellä määrällä havaintoja. Onko se liian ongelmallista tutkimuksellesi, on arvostelukutsu.

clear all set more off program define sim, rclass tempname z se foreach i of numlist 5/10 20(10)50 { drop _all set obs `i" gen x = rnormal() gen y = rnormal() corr x y scalar `z" = atanh(r(rho)) scalar `se" = 1/sqrt(r(N)-3) return scalar p`i" = 2*normal(-abs(`z"/`se")) } end simulate p5 =r(p5) p6 =r(p6) p7 =r(p7) /// p8 =r(p8) p9 =r(p9) p10 =r(p10) /// p20=r(p20) p30=r(p30) p40 =r(p40) /// p50=r(p50), reps(200000) nodots: sim simpplot p5 p6 p7 p8 p9 p10, name(small, replace) /// scheme(s2color) ylabel(,angle(horizontal)) 

kirjoita kuvan kuvaus tähän

simpplot p20 p30 p40 p50 , name(less_small, replace) /// scheme(s2color) ylabel(,angle(horizontal)) 

kirjoita kuvan kuvaus tähän

kommentit

  • Yritä vähentää $ n $: sta 2,5 2,5: n sijasta :-).

Vastaa

FWIW Näen suosituksen $ N \ ge 10 $ Myersissä & Well (tutkimuksen suunnittelu ja tilastolliset analyysit, toinen painos, 2003, s. 492). Alaviitteessä todetaan:

Tarkkaan ottaen $ Z $ -muunnos on puolueellinen määrä $ r / (2 (N-1)) $: katso Pearson ja Hartley (1954, s. 29). Tämä puolueellisuus on yleensä vähäpätöinen, ellei $ N $ ole pieni ja $ \ rho $ on suuri, ja jätämme sen huomioimatta.

Kommentit

  • Tämä näyttää siltä, että se on minulle vastaus.

Vastaa

Etkö ole varma, onko Fisherin s $ z $ -muunnos sopiva tähän. $ H_0: \ rho = 0 $ (HUOM: nollahypoteesi on populaatiolle $ \ rho $, ei näyte $ r $), korrelaatiokertoimen näytteenottojakauma on jo symmetrinen, joten vinoutta ei tarvitse vähentää, mikä Fisherin s $ z $ -tavoitteena on tehdä, ja voit käyttää Opiskelijan $ t $ -arviota.

Olettaen, että tarkoitat $ H_0: \ rho = \ rho_0 \ not = 0 $, niin kyseisen PDF: n vinous riippuu ehdotetusta arvosta arvosta $ \ rho_0 $, joten tällöin ei olisi yleistä vastausta siihen, kuinka suuren $ n $: n tulisi olla. $ n $: n vähimmäisarvot riippuvat myös merkittävyystasosta $ \ alpha $, jota kohti työskentelet. Et ilmoita sen arvo.

Nickin piste on oikea: likiarvot ja suositukset toimivat aina jollakin harmaalla alueella.

Jos Fisher ap läheisyys on riittävän hyvä (= symmetrinen), käytän sidottua $ n \ geq (t _ {\ alpha / 2} s / \ epsilon) ^ 2 $, joka soveltuu $ t $ -jakaumiin, joissa $ s $ on esimerkkistandardi poikkeama.Jos se on riittävän lähellä normaalia, tästä tulee $ n \ geq (1,96 s / \ epsilon) ^ 2 $.

Kommentit

  • Luulen tämä yksinkertaistaa liikaa Fisherin ” tavoite ” ’ s $ z $, mikä on osittain sekä tarkoituksen että matematiikan kysymys. Vinosuus tai ei, on vain osa kuvaa; $ z $ muuntaa rajoitetun jakauman rajattomaksi, mikä on tärkeää luottamusvälien kannalta. Itse asiassa väittäisin, että ellei nollakorrelaation nollahypoteesi ole myös tieteellinen kysymys, Fisher ’ s $ z $: n käyttö luottamusväleihin on paljon hedelmällisempää kuin yrittää saada P-arvo.
  • I ’ m anteeksi, olen uusi Fisher ’ s $ z $ -muunnos. Pitäisikö minun käyttää sitä vain, jos haluan testata $ H_0: \ rho = \ rho_0 \ neq 0 $? Syy P-arvojen laskemiseen on, että haluan käyttää Holm-Bonferroni-menetelmää perhevirheiden hallitsemiseksi tehtäessä useita vertailuja. Pitäisikö minun mieluummin laskea P-arvot opiskelijan ’ s $ t $ -jakelusta?
  • Kysymys on mielestäni väärä. Fisher ’ s $ z $ on parempi menetelmä luottamusväleille ja yleensä päätelmille. Useimmat ohjelmistot, luulen, käyttävät $ t $ -pohjaista laskutoimitusta $ \ rho = 0 $. Jos olet epävarma, voi olla todella tärkeää näyttää, onko yhden menetelmän käyttämisellä merkitystä tietojesi kannalta. Joten jos menetelmät sopivat, ei ole ongelmaa.
  • Voit lukea lisää Fisher ’ s $ z $ -muunnoksesta täältä: stata-journal.com/article.html?article=pr0041
  • Ok, kiitos @NickCox! @Lucozade, mikä on $ \ epsilon $ sidottuun $ n $: een?

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *