Egy mintakorrelációt szeretnék tesztelni a $ r $ jelentősége szempontjából, p-értékek használatával, vagyis

$ H_0: \ rho = 0, \; H_1: \ rho \ neq 0. $

Megértettem, hogy Fisher z-transzformációjával ezt kiszámolhatom:

$ z_ {obs} = \ displaystyle \ frac {\ sqrt {n-3}} {2} \ ln \ balra (\ displaystyle \ frac {1 + r} {1-r} \ jobbra) $

és megtalálja a p-értéket

$ p = 2P \ bal (Z > z_ {obs} \ right) $

a normál normál elosztást használva.

A kérdésem az: mekkora legyen a $ n $, hogy ez megfelelő átalakítás legyen? Nyilvánvaló, hogy a $ n $ -nak nagyobbnak kell lennie, mint 3. A tankönyvem nem említ semmilyen korlátozást, de a ez az előadás azt mondja, hogy a $ n $ -nak nagyobbnak kell lennie, mint 10. Az általam figyelembe venni kívánt adatokhoz lesz valami, mint például $ 5 \ leq n \ leq 10 $.

Megjegyzések

  • A Wikipédia oldalon felsoroljuk a $ z_ {obs szokásos hibáját } $, amelyet a $ 1 / \ sqrt {N-3} $ ad meg, ahol $ N $ a minta mérete. Tehát ‘ l legalább 4 teljes párra van szüksége. I nincs tudomásom a mintanagyságot meghaladó korlátozásokról.
  • Nem biztos benne, mennyire bízhat meg egy olyan prezentációban, aki ‘ t megírják saját egyetemi nevüket. Komolyabban, vigyázzon minden olyan tanácsra, amely azt sugallja, hogy a dolgok rendben vannak egy bizonyos mintanagyság felett, és máskülönben súlyosak. ‘ a közelítés minőségének kérdése, amely a minta méretével és az adatok eloszlásától függően simán növekszik. Egyszerű tanács: nagyon körültekintően viselkedni, mindent megtervezni és ellenőrizni a rendszerindítással megbízható időközökkel.
  • A 17. dia leírja a $ \ rho = 0 $ speciális eset t-tesztjét.
  • A courses.education.illinois.edu/EdPsy580/lectures/… előadás linkje megszakadt ,

válasz

Ilyen kérdésekhez csak futtatnék egy szimulációt, és megnézném, hogy a $ p $ – az értékek úgy viselkednek, ahogy elvárom tőlük. A $ p $ -érték annak a valószínűsége, hogy véletlenszerűen kiválaszt egy mintát, amely legalább annyira eltér a null-hipotézistől, mint a megfigyelt adatok, ha a null-hipotézis igaz. Tehát, ha sok ilyen mintánk lenne, és egyikük $ p $ értéke 0,04 lenne, akkor azt várhatnánk, hogy a minták 4% -ának értéke kisebb lesz, mint 04. Ugyanez vonatkozik az összes többi lehetséges $ p $ értékre.

Az alábbiakban a Stata szimulációja található. A grafikonok ellenőrzik, hogy a $ p $ -értékek azt mérik-e, amit állítólag mérni kell, vagyis megmutatják, hogy a névleges $ p $ értéknél kisebb $ p $ értékű minták aránya mennyivel tér el a névleges $ p értéktől $ -value. Amint láthatja, a teszt kissé problematikus ilyen kevés megfigyelés esetén. Függetlenül attól, hogy túl problematikus-e a kutatása szempontjából, az az ön megítélése.

clear all set more off program define sim, rclass tempname z se foreach i of numlist 5/10 20(10)50 { drop _all set obs `i" gen x = rnormal() gen y = rnormal() corr x y scalar `z" = atanh(r(rho)) scalar `se" = 1/sqrt(r(N)-3) return scalar p`i" = 2*normal(-abs(`z"/`se")) } end simulate p5 =r(p5) p6 =r(p6) p7 =r(p7) /// p8 =r(p8) p9 =r(p9) p10 =r(p10) /// p20=r(p20) p30=r(p30) p40 =r(p40) /// p50=r(p50), reps(200000) nodots: sim simpplot p5 p6 p7 p8 p9 p10, name(small, replace) /// scheme(s2color) ylabel(,angle(horizontal)) 

írja ide a kép leírását

simpplot p20 p30 p40 p50 , name(less_small, replace) /// scheme(s2color) ylabel(,angle(horizontal)) 

írja ide a kép leírását

Megjegyzések

  • Próbáljon kivonni 3 helyett 2,5-et a $ n $ -ból :-).

Válasz

FWIW Látom a $ N \ ge 10 $ ajánlást Myers-ben & Nos (kutatási tervezés és statisztikai elemzések, második kiadás, 2003, 492. o.). A lábjegyzet a következőket mondja ki:

Szigorúan véve a $ Z $ transzformációt torzítja egy $ r / (2 (N-1)) $ összeg: lásd Pearson és Hartley (1954, 29. o.). Ez az elfogultság általában elhanyagolható lesz, kivéve, ha a $ N $ kicsi és a $ \ rho $ nagy, és itt figyelmen kívül hagyjuk.

Megjegyzések

  • Ez úgy tűnik, hogy válasz nekem.

Válasz

Nem biztos benne, hogy a Fisher s $ z $ átalakítása megfelelő-e itt. $ H_0 esetén: \ rho = 0 $ (NB: a nullhipotézis a $ \ rho $ populációra vonatkozik, nem a $ r $ mintára vonatkozik), a korrelációs együttható mintavételi eloszlása már szimmetrikus, ezért nem szükséges csökkenteni a ferdeséget, amit Fisher s $ z $ célja csináld, és használhatod a Student s $ t $ közelítését.

Feltételezve, hogy a $ H_0-ra gondolsz: \ rho = \ rho_0 \ not = 0 $, akkor az adott PDF ferdesége a javasolt értéktől függ. a $ \ rho_0 $ értéke, tehát akkor nem lenne általános válasz arra, hogy mekkora legyen a $ n $. Továbbá, a $ n $ minimális értéke attól a $ \ alpha $ jelentőségi szinttől függ, amely felé dolgozik. Nem adja meg az értékét.

Nick pontja a megfelelő: a közelítések és az ajánlások mindig valamilyen szürke területen működnek.

Ha akkor a Fisher ap a közelség elég jó (= szimmetrikus), a kötött $ n \ geq (t _ {\ alpha / 2} s / \ epsilon) ^ 2 $ értéket használnám a $ t $ elosztásokra, ahol $ s $ a minta standard eltérés.Ha elég közel van a normálishoz, akkor ez $ n \ geq (1,96 s / \ epsilon) ^ 2 $ lesz.

Megjegyzések

  • szerintem ez túlságosan leegyszerűsíti Fisher ” célját “, amely részben részben a cél, valamint a matematika kérdése. A ferdeség vagy sem csak a kép része; A $ z $ a korlátozott elosztást korlátlaná alakítja, ami fontos a konfidencia intervallumok szempontjából. Valójában azt állítom, hogy ha a nulla korreláció nullhipotézise sem tudományos kérdés, Fisher ‘ s $ z $ használata konfidencia intervallumokra sokkal gyümölcsözőbb, mint megpróbálni kap egy P-értéket.
  • I ‘ sajnálom, új vagyok a Fisher ‘ s $ z számára $ -transform. Csak akkor használjam, ha tesztelni akarom a $ H_0 -t: \ rho = \ rho_0 \ neq 0 $? A P-értékek kiszámításának oka az, hogy a Holm-Bonferroni-módszert szeretném felhasználni a családonkénti hibaarány szabályozására több összehasonlítás során. Inkább a P-értékeket kell kiszámítanom egy Student ‘ s $ t $ eloszlásból?
  • Szerintem a kérdés nem megfelelő. Fisher ‘ s $ z $ jobb módszer a konfidencia intervallumokra és általában a következtetésre. Gondolom, a legtöbb szoftver $ t $ alapú számítást használ a $ \ rho = 0 $ teszteléséhez. Ha kétségei vannak, akkor nagyon fontos lehet megmutatni, hogy egy módszer használata jelent-e különbséget az adatai szempontjából. Tehát, ha a módszerek egyetértenek, nincs probléma.
  • A Fisher ‘ s $ z $ átalakításáról itt olvashat bővebben: stata-journal.com/article.html?article=pr0041
  • Ok, köszönöm @NickCox! @Lucozade, mi a $ \ epsilon $ a $ n $ -hoz kötött?

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük