För en effektstorleksanalys märker jag att det finns skillnader mellan Cohen ”sd, Hedges” sg och Hedges ”g *.

  • Är dessa tre mätvärden normalt mycket lika?
  • Hur skulle de ge olika resultat?
  • Är det också en fråga om preferenser som jag använder eller rapporterar med?

Kommentarer

Svar

Både Cohen” sd och Hedges ”g poolvariationer med antagandet om lika populationsvariationer, men g pooler som använder n – 1 för varje prov istället för n, vilket ger en bättre uppskattning, särskilt ju mindre provstorlekarna. Både d och g är något positivt förspända, men endast försumbar för måttliga eller större provstorlekar. Bias reduceras med g *. D av Glass antar inte lika varians, så det använder sd för en kontrollgrupp eller baslinjejämförelsesgrupp som standardiserare för skillnaden mellan de två medel.

Dessa effektstorlekar och Cliffs och andra icke-parametriska effektstorlekar diskuteras i detalj i min bok:

Grissom, RJ, & Kim, J, J. (2005). Effektstorlekar för forskning: A bred praktisk metod Mahwah, NJ: Erlbaum.

Svar

Enligt min förståelse är Hedges ”sg en något mer exakt version av Cohen ”sd (med poolad SD) genom att vi lägger till en korrigeringsfaktor för litet urval. Båda åtgärderna är i allmänhet överens när antagandet om homoscedasticitet inte bryts, men vi kan hitta situationer där detta inte är fallet, se t.ex. McGrath & Meyer, Psykologiska metoder 2006, 11 (4) : 386-401. Andra artiklar listas i slutet av mitt svar.

I allmänhet fann att i nästan alla psykologiska eller biomedicinska studier är detta Cohens d som rapporteras; detta står troligen från den välkända tumregeln för att tolka dess storlek (Cohen, 1988). Jag vet inte om någon tidning som nyligen betraktar Hedgess g (eller Cliff delta som ett icke-parametriskt alternativ). Bruce Thompson har en reviderad version av APA-avsnittet om effektstorlek.

Googling om Monte Carlo-studier kring effektstorleksmått, jag hittade det här papper som kan vara intressant (jag läste bara abstrakt och simuleringsinställningar): Robusta förtroendeintervall för effektstorlekar: En jämförande studie av Cohens d och Cliffs Delta under icke-normalitet och Heterogena avvikelser (pdf).

Om din andra kommentar innehåller MBESS R-paketet olika verktyg för ES-beräkning (t.ex. smd och relaterade funktioner).

Andra referenser

  1. Zakzanis, KK (2001). Statistik för att säga sanningen, hela sanningen och ingenting annat än sanningen: Formler, illustrativa numeriska exempel och heuristisk tolkning av effektstorleksanalyser för neuropsykologiska forskare. Arkiv för klinisk neuropsykologi , 16 (7), 653-667.
  2. Durlak, J.A. (2009). Hur man väljer, beräknar och tolkar effektstorlekar. Journal of Pediatric Psychology

Kommentarer

  • En anonym användare ville lägga till följande definition av homoscedasticity för de som kanske inte känner till termen: ” en egenskap för en uppsättning slumpmässiga variabler där varje variabel har samma ändliga varians ”.

Svar

Det verkar när människor säger Cohen ”sd menar de mest:

$$ d = \ frac {\ bar {x} _1 – \ bar {x} _2} {s} $$

Var $ s $ är den sammanlagda standardavvikelsen,

$$ s = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2 – 2}} $$

Det finns andra uppskattare för den sammanslagna standardavvikelsen, förmodligen den vanligaste förutom ovanstående:

$$ s ^ * = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2}} $$

Notering här är anmärkningsvärt inkonsekvent, men ibland säger folk att $ s ^ * $ (dvs. $ n_1 + n_2 $ version) version kallas Cohen ”s $ d $ och reservera namnet Hedge” s $ g $ för v ersion som använder $ s $ (dvs. med Bessels korrigering, versionen n1 + n2−2). Detta är lite konstigt eftersom Cohen skisserade båda uppskattarna för den sammanlagda standardavvikelsen (t.ex. $ s $ version på s. 67, Cohen, 1977) innan Hedges skrev om dem (Hedges, 1981).

Andra gånger är Hedge ”sg reserverad för att hänvisa till någon av de biaskorrigerade versionerna av en standardiserad medelskillnad som Hedges utvecklade. Hedges (1981) visade att Cohen” sd var uppåt förspänd (dvs. dess förväntade värde är högre än det sanna populationsparametervärdet), särskilt i små prover, och föreslog en korrigeringsfaktor för att korrigera för Cohen ”sd” s bias:

Hedges ”sg (den opartiska uppskattaren ):

$$ g = d * (\ frac {\ Gamma (df / 2)} {\ sqrt {df / 2 \,} \, \ Gamma ((df-1) / 2)}) $$ Där $ df = n_1 + n_2 -2 $ för en oberoende gruppdesign och $ \ Gamma $ är gammafunktionen. (ursprungligen Hedges 1981, den här versionen utvecklades från Hedges och Olkin 1985, s. 104)

Denna korrigeringsfaktor är emellertid ganska beräkningsmässigt komplex, så Hedges gav också en beräkningsmässigt triviell uppskattning som, även om den fortfarande är lite partisk, är bra för nästan alla tänkbara ändamål: class = ”math-container”> $ g ^ * $ (den beräkningsmässigt triviala approximationen):

$$ g ^ * = d * ( 1 – \ frac {3} {4 (df) – 1}) $$ Där $ df = n_1 + n_2 -2 $ för oberoende grupper design.

(Ursprungligen från Hedges, 1981, den här versionen från Borenstein, Hedges, Higgins, & Rothstein, 2011, s. 27)

Men när det gäller vad människor menar när de säger Cohen ”sd vs. häckar” g vs g *, verkar folk hänvisa till någon av dessa tre uppskattare som Hedge ”sg eller Cohen” sd omväxlande, även om jag aldrig har sett någon skriv ” $ g ^ * $ ” i ett icke-metodologiskt / statistiskt forskningspapper. Om någon säger ”opartisk Cohen” sd ”måste du bara ta din bästa gissning på någon av de två sista (och jag tror att det till och med kan finnas en annan approximation som har använts för Hedge ”s $ g ^ * $ också!) .

De är alla praktiskt taget identiska om $ n > 20 $ eller så, och allt kan vara tolkas på samma sätt. För alla praktiska ändamål, såvida du inte har att göra med riktigt små provstorlekar, spelar det förmodligen ingen roll vilken du använder (även om du kan välja kan du lika gärna använda den som jag har kallat Hedges ”g, eftersom den är opartisk).

Referenser :

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Introduktion till metaanalys. West Sussex, Storbritannien: John Wiley & Sons.

Cohen, J. (1977). Statistisk kraftanalys för beteendevetenskap (2: a upplagan). Hillsdale, NJ, USA: Lawrence Erlbaum Associates, Inc.

Hedges, L. V. (1981). Distribution Theory for Glass ”Estimator of Effect size and Related Estimators. Journal of Educational Statistics, 6 (2), 107-128. Doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Statistiska metoder för metaanalys San Diego, CA: Academic Press

Svar

Om du bara försöker förstå grundläggande betydelse av Hedges ”g, som jag är, kanske du också tycker att det här är till hjälp:

Storleken på Hedges g kan tolkas med hjälp av Cohen” s (1988 [2]) konvention som liten (0,2), medium (0,5) och stor (0,8). [1]

Deras definition är kort och tydlig:

Hedges g är en variant av Cohen ”sd som korrigerar för fördomar på grund av små provstorlekar (Hedges & Olkin, 1985).[1] fotnot

Jag skulle uppskatta statistikexperter som redigerar detta för att lägga till viktiga försiktighetsåtgärder till det lilla (0,2) mediet (0,5) och det stora (0,8) anspråk, för att hjälpa icke-experter att undvika misstolkning av häckar ”g-nummer som används i samhällsvetenskaplig och psykologisk forskning.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Effekten av mindfulness-baserad terapi på ångest och depression: En meta-analytisk granskning Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt och Diana Oh. J Consult Clin Psychol. 2010 april ; 78 (2): 169–183. Doi: 10.1037 / a0018555

[2] Cohen J. Statistisk kraftanalys för beteendevetenskap. 2: a upplagan Erlbaum; Hillsdale, NJ: 1988 (citerad i [ 1])

Kommentarer

  • +1. Re: liten-medelstor, som ett första pass, om du inte har någon relevant kunskap eller sammanhang vad som helst, dessa ’ t-shirtstorlekar ’ är OK, men i verkligheten, vad är en liten eller stor effekt kommer varierar beroende på disciplin eller ämne. Dessutom, bara för att en effekt är ’ stor ’ betyder det inte ’ t ’ är praktiskt taget viktigt eller teoretiskt meningsfullt.

Svar

andra affischer har täckt frågan om likheter och skillnader mellan g och d. Bara för att lägga till detta tycker vissa forskare att de effektstorleksvärden som Cohen erbjuder är alldeles för generösa, vilket leder till övertolkning av svaga effekter. De är inte heller bundna till r vilket leder till att forskare kan konvertera fram och tillbaka för att få mer fördelaktiga tolkningsbara effektstorlekar. Ferguson (2009, Professional Psychology: Research and PRactice) föreslog att man använder följande värden för tolkning för g:

.41, som rekommenderat minimum för ”praktisk betydelse.” 1.15, måttlig effekt 2.70, stark effekt

Dessa är uppenbarligen strängare / svårare att uppnå och inte många samhällsvetenskapliga experiment kommer att få starka effekter … vilket är förmodligen hur det borde vara.

Svar

Bruce Thompson varnade för att använda Cohen ”s (0,2) så liten (0,5) som medium och (0,8) som stor Cohen menade aldrig att dessa skulle användas som styva tolkningar. Alla effektstorlekar måste tolkas baserat på sammanhanget i den relaterade litteraturen. Om du analyserar de relaterade effektstorlekarna som rapporterats om ditt ämne och de är (0,1) (0,3) ( 0,24) och du producerar en effekt av (0,4) då kan det vara ”stort”. Omvänt, om all relaterad litteratur har effekter av (0,5) (0,6) (0,7) och du har effekten av (0,4) kan det vara Jag anser att detta är ett trivialt exempel men absolut nödvändigt. Jag tror att Thompson en gång sa i en uppsats, ”Vi skulle bara vara dumma i en annan mått” när man jämför tolkningar av fektstorlekar till hur samhällsvetare tolkade p-värden vid den tiden.

Svar

Effektstorlek är mått på association, vi borde beskriv alltid resultaten i termer av storleksmått – vårt studieresultat måste kunna berätta inte bara om behandlingen är effektiv eller inte utan hur mycket den är effektiv. Hedges g och Cohen ”s är otroligt jämförbara. Båda har en uppåtgående benägenhet (en svullnad) i eftereffekter på upp till cirka 4%. De två insikterna är i grunden desamma som med undantag för när teststorlekar är under 20, när Hedges ”g slår Cohen” s. Stöder ”g kallas följaktligen gång på gång den åtgärdade påverkansstorleken.

  • För mycket små provstorlekar (< 20) välj Hedges g över Cohens d.
  • För provstorlekar> 20 är resultaten för båda statistiken ungefär ekvivalenta.

Både Cohens d och Hedges g har samma tolkning:

  • Liten effekt (kan inte urskiljas med blotta ögat) = 0,2
  • Medium effekt = 0,5
  • Stor effekt (kan ses med blotta ögat) = 0,8

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *