For en effektstørrelsesanalyse bemærker jeg, at der er forskelle mellem Cohen “sd, Hedges” sg og Hedges “g *.

  • Er disse tre målinger normalt meget ens?
  • Hvad ville være et tilfælde, hvor de ville give forskellige resultater?
  • Er det også et spørgsmål om præference, som jeg bruger eller rapporterer med?

Kommentarer

Svar

Både Cohen” sd og Hedges “g puljeafvigelser på antagelsen om lige befolkningsvariationer, men g puljer, der bruger n – 1 for hver prøve i stedet for n, hvilket giver et bedre skøn, især jo mindre prøvestørrelserne. Både d og g er noget positivt forudindtaget, men kun ubetydeligt for moderate eller større stikprøvestørrelser. Bias reduceres ved hjælp af g *. D fra Glass antager ikke lige store afvigelser, så det bruger sd for en kontrolgruppe eller baseline-sammenligningsgruppe som standardiserende for forskellen mellem de to midler.

Disse effektstørrelser og Cliffs og andre ikke-parametriske effektstørrelser diskuteres detaljeret i min bog:

Grissom, RJ, & Kim, J, J. (2005). Effektstørrelser til forskning: A bred praktisk tilgang. Mahwah, NJ: Erlbaum.

Svar

Efter min forståelse er Hedges “sg en noget mere præcis version af Cohen “sd (med samlet SD) ved, at vi tilføjer en korrektionsfaktor for lille prøve. Begge målinger er generelt enige, når antagelsen om homoscedasticitet ikke overtrædes, men vi kan finde situationer, hvor dette ikke er tilfældet, se f.eks. = “f762be2100”>

Meyer, Psykologiske metoder 2006, 11 (4) : 386-401. Andre papirer er anført i slutningen af mit svar.

Jeg generelt fandt ud af, at i næsten alle psykologiske eller biomedicinske studier er dette Cohens d, der rapporteres; dette står sandsynligvis fra den velkendte tommelfingerregel til fortolkning af dens størrelse (Cohen, 1988). Jeg ved ikke noget nyt papir, der betragter Hedges s g (eller Cliff delta som et ikke-parametrisk alternativ). Bruce Thompson har en revideret version af APA-sektionen om effektstørrelse.

Googling om Monte Carlo-undersøgelser omkring effektstørrelsesmål, jeg fandt dette papir, der kan være interessant (jeg læser kun abstrakt og simuleringsopsætningen): Robuste tillidsintervaller for effektstørrelser: En sammenlignende undersøgelse af Cohens d og Cliffs Delta under ikke-normalitet og Heterogene afvigelser (pdf).

Om din 2. kommentar inkluderer MBESS R-pakken forskellige hjælpeprogrammer til ES-beregning (f.eks. smd og relaterede funktioner).

Andre referencer

  1. Zakzanis, KK (2001). Statistik for at fortælle sandheden, hele sandheden og intet andet end sandheden: Formler, illustrative numeriske eksempler og heuristisk fortolkning af effektstørrelsesanalyser for neuropsykologiske forskere. Arkiv for klinisk neuropsykologi , 16 (7), 653-667.
  2. Durlak, J.A. (2009). Sådan vælges, beregnes og fortolkes effektstørrelser. Journal of Pediatric Psychology

Kommentarer

  • En anonym bruger ønskede at tilføje følgende definition af homoscedasticity for dem, der muligvis ikke kender med udtrykket: ” en egenskab af et sæt tilfældige variabler, hvor hver variabel har den samme endelige varians “.

Svar

Det ser ud til, at når folk siger Cohen “sd, betyder de mest:

$$ d = \ frac {\ bar {x} _1 – \ bar {x} _2} {s} $$

Hvor $ s $ er den samlede standardafvigelse,

$$ s = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2 – 2}} $$

Der er andre estimatorer for den samlede standardafvigelse, sandsynligvis den mest almindelige bortset fra ovenstående:

$$ s ^ * = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2}} $$

Notation her er bemærkelsesværdigt inkonsekvent, men nogle gange siger folk, at $ s ^ * $ (dvs. $ n_1 + n_2 $ version) version kaldes Cohen “s $ d $ , og reserver navnet Hedge” s $ g $ til v ersion, der bruger $ s $ (dvs. med Bessels korrektion versionen n1 + n2−2). Dette er lidt underligt, da Cohen skitserede begge estimatorer for den samlede standardafvigelse (f.eks. $ s $ version på s. 67, Cohen, 1977), før Hedges skrev om dem (Hedges, 1981).

Andre gange er Hedge “sg forbeholdt at henvise til en af de biaskorrigerede versioner af en standardiseret gennemsnitlig forskel, som Hedges udviklede. Hedges (1981) viste, at Cohen” sd var opadvendt forudindtaget (dvs. dens forventede værdi er højere end den sande populationsparameterværdi), især i små prøver, og foreslog en korrektionsfaktor for at korrigere for Cohen “sd” s bias:

Hedges “sg (den objektive estimator ):

$$ g = d * (\ frac {\ Gamma (df / 2)} {\ sqrt {df / 2 \,} \, \ Gamma ((df-1) / 2)}) $$ Hvor $ df = n_1 + n_2 -2 $ til et uafhængigt gruppedesign og $ \ Gamma $ er gamma-funktionen. (oprindeligt Hedges 1981, denne version er udviklet fra Hedges og Olkin 1985, s. 104)

Denne korrektionsfaktor er dog ret beregningsmæssigt kompleks, så Hedges gav også en beregningsmæssig triviel tilnærmelse, der, selvom den stadig er lidt forudindtaget, er fin til næsten alle tænkelige formål:

Hedges “ $ g ^ * $ (den beregningsmæssigt trivielle tilnærmelse):

$$ g ^ * = d * ( 1 – \ frac {3} {4 (df) – 1}) $$ Hvor $ df = n_1 + n_2 -2 $ for uafhængige grupper design.

(Oprindeligt fra Hedges, 1981, denne version fra Borenstein, Hedges, Higgins, & Rothstein, 2011, s. 27)

Men hvad folk mener, når de siger Cohen “sd vs. hække” g vs g *, synes folk at henvise til nogen af disse tre estimatorer som Hedge “sg eller Cohen” sd ombytteligt, selvom jeg aldrig har set nogen skriv “ $ g ^ * $ ” i et ikke-metodisk / statistisk forskningspapir. Hvis nogen siger “upartisk Cohen” sd “, bliver du bare nødt til at gætte dit bedste gæt på en af de sidste to (og jeg tror, der kan endda være en anden tilnærmelse, der også er blevet brugt til Hedge “s $ g ^ * $ !) .

De er alle næsten identiske, hvis $ n > 20 $ eller deromkring, og alt kan være fortolket på samme måde. Medmindre du har at gøre med rigtig små stikprøvestørrelser, betyder det sandsynligvis ikke noget, hvad du bruger (selvom du kan vælge, kan du lige så godt bruge den, som jeg har kaldt Hedges “g, som den er upartisk).

Referencer :

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Introduktion til metaanalyse. West Sussex, Storbritannien: John Wiley & Sønner.

Cohen, J. (1977). Statistisk magtanalyse for adfærdsvidenskab (2. udgave). Hillsdale, NJ, USA: Lawrence Erlbaum Associates, Inc.

Hedges, L. V. (1981). Distribution Theory for Glass “Estimator of Effect size and Related Estimators. Journal of Educational Statistics, 6 (2), 107-128. Doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Statistiske metoder til metaanalyse San Diego, Californien: Academic Press

Svar

Hvis du bare prøver at forstå grundlæggende betydning af Hedges “g, som jeg er, kan du også finde det nyttigt:

Størrelsen af Hedges g kan fortolkes ved hjælp af Cohens (1988 [2]) konvention som lille (0,2), medium (0,5) og stor (0,8). [1]

Deres definition er kort og klar:

Hedges g er en variation af Cohen “sd, der korrigerer for forspændinger på grund af små stikprøvestørrelser (Hedges & Olkin, 1985).[1] fodnote

Jeg vil sætte pris på statistikeksperter, der redigerer dette for at tilføje vigtige forbehold til det lille (0,2) medium (0,5) og det store (0,8) hævder at hjælpe ikke-eksperter med at undgå fejlagtig fortolkning af hegn “g-tal brugt i samfundsvidenskabelig og psykologisk forskning.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Effekten af mindfulness-baseret terapi på angst og depression: En meta-analytisk gennemgang Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt og Diana Oh. J Consult Clin Psychol. 2010 april ; 78 (2): 169–183. Doi: 10.1037 / a0018555

[2] Cohen J. Statistisk magtanalyse for adfærdsvidenskab. 2. udgave Erlbaum; Hillsdale, NJ: 1988 (citeret i [ 1])

Kommentarer

  • +1. Re: lille-mellemstor, som en første pas, hvis du ikke har nogen relevant viden eller kontekst overhovedet, disse ‘ t-shirtstørrelser ‘ er OK, men i virkeligheden, hvad er en lille eller stor effekt vil varierer efter disciplin eller emne. Desuden, bare fordi en effekt er ‘ stor ‘ betyder det ikke ‘ det nødvendigvis ‘ er praktisk vigtig eller teoretisk meningsfuld.

Svar

andre plakater har dækket spørgsmålet om ligheder og forskelle mellem g og d. Bare for at tilføje til dette føler nogle forskere, at de effektstørrelsesværdier, der tilbydes af Cohen, er alt for generøse, hvilket fører til overfortolkning af svage effekter. De er heller ikke bundet til r, hvilket fører til muligheden for, at forskere kan konvertere frem og tilbage for at opnå mere gunstigt fortolkelige effektstørrelser. Ferguson (2009, Professional Psychology: Research and PRactice) foreslog at bruge følgende værdier til fortolkning for g:

.41, som det anbefalede minimum for “praktisk betydning.” 1,15, moderat effekt 2,70, stærk effekt

Disse er tydeligvis strengere / sværere at opnå, og ikke mange samfundsvidenskabelige eksperimenter kommer til at få stærke effekter … hvilket sandsynligvis skulle være.

Svar

Bruce Thompson advarede ikke om at bruge Cohens (0.2) så lille (0.5) som medium og (0.8) så stor Cohen har aldrig ment, at disse skal bruges som stive fortolkninger. Alle effektstørrelser skal fortolkes ud fra sammenhængen med den relaterede litteratur. Hvis du analyserer de relaterede effektstørrelser, der er rapporteret om dit emne, og de er (0,1) (0,3) ( 0,24) og du producerer en effekt på (0,4), så kan den være “stor”. Omvendt, hvis al den relaterede litteratur har effekter på (0,5) (0,6) (0,7), og du har virkningen af (0,4), kan den være betragtes som lille. Jeg ved, at dette er et trivielt eksempel, men bydende vigtigt. Jeg tror, at Thompson engang sagde i en artikel: “Vi ville bare være dumme i en anden metrik”, når man sammenligner fortolkninger af e fektstørrelser til, hvordan samfundsvidenskabere fortolker p-værdier på det tidspunkt.

Svar

Effektstørrelse er mål for tilknytning, vi skal Beskriv altid resultaterne med hensyn til størrelsesmål – vores undersøgelsesresultat skal være i stand til ikke kun at fortælle, om behandlingen er effektiv eller ej, men hvor meget den er effektiv. Hedges g og Cohen “s er utroligt sammenlignelige. Begge har en opadgående disposition (en hævelse) i eftervirkninger på op til ca. 4%. De to indsigter er fundamentalt de samme som med undtagelse af, når teststørrelser er under 20, når Hedges “g slår Cohen” s. Understøtter “g kaldes derfor igen og igen den afhjælpede virkningsstørrelse.

  • For meget små stikprøvestørrelser (< 20) vælg Hedges g over Cohens d.
  • For stikprøvestørrelser> 20 er resultaterne for begge statistikker nogenlunde ækvivalente.

Både Cohens d og Hedges g har samme fortolkning:

  • Lille effekt (kan ikke skelnes med det blotte øje) = 0,2
  • Medium effekt = 0,5
  • Stor effekt (kan ses med det blotte øje) = 0,8

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *