Bei einer Effektgrößenanalyse stelle ich fest, dass es Unterschiede zwischen Cohen „sd, Hedges“ sg und Hedges „g * gibt.

  • Sind diese drei Metriken normalerweise sehr ähnlich?
  • Was wäre ein Fall, in dem sie unterschiedliche Ergebnisse liefern würden?
  • Ist es auch eine Frage der Präferenz, die ich verwende oder mit der ich berichte?

Kommentare

Antwort

Sowohl Cohen“ sd als auch Hedges „g-Pool-Varianzen unter der Annahme gleicher Populationsvarianzen, aber g-Pools, die n – 1 für jede Stichprobe anstelle von n verwenden, was eine bessere Schätzung liefert, insbesondere je kleiner die Stichprobengrößen sind. Sowohl d als auch g sind etwas positiv vorgespannt, jedoch nur vernachlässigbar für moderate oder größere Probengrößen. Die Vorspannung wird mit g * reduziert. Das d by Glass nimmt keine gleichen Varianzen an, daher wird das sd einer Kontrollgruppe oder einer Basislinienvergleichsgruppe als Standardisierer für die Differenz zwischen den beiden Mitteln verwendet.

Diese Effektgrößen und Cliffs und andere Nichtparametrische Effektgrößen werden in meinem Buch ausführlich behandelt:

Grissom, RJ, & Kim, J, J. (2005). Effektgrößen für die Forschung: A. breiter praktischer Ansatz. Mahwah, NJ: Erlbaum.

Antwort

Nach meinem Verständnis ist Hedges „sg eine etwas genauere Version von Cohen „sd (mit gepoolter SD), indem wir einen Korrekturfaktor für eine kleine Stichprobe hinzufügen. Beide Maßnahmen stimmen im Allgemeinen überein, wenn die Homoskedastizitätsannahme nicht verletzt wird, aber wir können Situationen finden, in denen dies nicht der Fall ist, siehe z. B. McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401. Andere Artikel sind am Ende meiner Antwort aufgeführt.

Ich im Allgemeinen fanden heraus, dass in fast allen psychologischen oder biomedizinischen Studien dies das Cohens d ist, über das berichtet wird; Dies ergibt sich wahrscheinlich aus der bekannten Faustregel für die Interpretation seiner Größe (Cohen, 1988). Ich weiß nichts über neuere Arbeiten, die Hedges g (oder Cliff Delta als nicht parametrische Alternative) in Betracht ziehen. Bruce Thompson hat eine überarbeitete Version des APA-Abschnitts zur Effektgröße.

Als ich über Monte-Carlo-Studien zu Effektgrößenmaßen googelte, fand ich dies Papier, das interessant sein könnte (ich habe nur das Abstract und den Simulationsaufbau gelesen): Robuste Konfidenzintervalle für Effektgrößen: Eine vergleichende Studie von Cohens d- und Cliff-Delta unter Nichtnormalität und Heterogene Varianzen (pdf).

Zu Ihrem zweiten Kommentar enthält das Paket MBESS R verschiedene Dienstprogramme für die ES-Berechnung (z. B. smd und verwandte Funktionen).

Andere Referenzen

  1. Zakzanis, KK (2001). Statistiken, um die Wahrheit, die ganze Wahrheit und nichts als die Wahrheit zu sagen: Formeln, illustrative numerische Beispiele und heuristische Interpretation von Effektgrößenanalysen für neuropsychologische Forscher. Archives of Clinical Neuropsychology , 16 (7), 653-667.
  2. Durlak, J.A. (2009). Auswählen, Berechnen und Interpretieren von Effektgrößen. Journal of Pediatric Psychology

Kommentare

  • Ein anonymer Benutzer wollte die folgende Definition von Homoskedastizität für diejenigen, die mit dem Begriff möglicherweise nicht vertraut sind: “ eine Eigenschaft einer Reihe von Zufallsvariablen, bei denen jede Variable vorhanden ist die gleiche endliche Varianz „.

Antwort

Wenn Leute Cohen „sd sagen, meinen sie meistens:

$$ d = \ frac {\ bar {x} _1 – \ bar {x} _2} {s} $$

Wobei $ s $ ist die gepoolte Standardabweichung,

$$ s = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2 – 2}} $$

Es gibt andere Schätzer für die gepoolte Standardabweichung, wahrscheinlich die häufigste, abgesehen von den oben genannten:

$$ s ^ * = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2}} $$

Die Notation hier ist bemerkenswert inkonsistent, aber manchmal sagen die Leute, dass die $ s ^ * $ (dh die $ n_1 + n_2 $ -Version) Die Version heißt Cohens $ d $ und reserviert den Namen Hedge „s $ g $ für die v Version, die $ s $ verwendet (d. h. mit Bessels Korrektur die Version n1 + n2−2). Dies ist etwas seltsam, da Cohen beide Schätzer für die gepoolte Standardabweichung (z. B. $ s $ -Version auf S. 67, Cohen, 1977) skizzierte, bevor Hedges darüber schrieb (Hedges, 1981).

In anderen Fällen ist Hedge „sg vorbehalten, sich auf eine der vorspannungskorrigierten Versionen einer von Hedges entwickelten standardisierten mittleren Differenz zu beziehen. Hedges (1981) zeigte, dass Cohen“ sd nach oben vorgespannt war (dh sein erwarteter Wert ist höher als der wahre Populationsparameterwert), insbesondere in kleinen Stichproben, und schlug einen Korrekturfaktor vor, um Cohens „sd“ -Vorspannung zu korrigieren:

Hedges „sg (der unverzerrte Schätzer ):

$$ g = d * (\ frac {\ Gamma (df / 2)} {\ sqrt {df / 2 \,} \, \ Gamma ((df-1) / 2)}) $$ Wobei $ df = n_1 + n_2 -2 $ für ein unabhängiges Gruppendesign und $ \ Gamma $ ist die Gammafunktion (ursprünglich Hedges 1981, diese Version entwickelt von Hedges und Olkin 1985, S. 104)

Dieser Korrekturfaktor ist jedoch ziemlich rechenintensiv, sodass Hedges auch eine rechnerisch triviale Näherung lieferte, die zwar immer noch leicht voreingenommen ist, aber für fast alle denkbaren Zwecke in Ordnung ist:

Hedges „ $ g ^ * $ (die rechnerisch triviale Näherung):

$$ g ^ * = d * ( 1 – \ frac {3} {4 (df) – 1}) $$ Wobei $ df = n_1 + n_2 -2 $ für eine unabhängige Gruppe Design.

(Ursprünglich von Hedges, 1981, diese Version von Borenstein, Hedges, Higgins, & Rothstein, 2011, S. 27)

Aber was die Leute meinen, wenn sie Cohen „sd vs. Hedges“ g vs. g * sagen, scheinen die Leute einen dieser drei Schätzer austauschbar als Hedge „sg oder Cohen“ sd zu bezeichnen, obwohl ich noch nie jemanden gesehen habe Schreiben Sie „ $ g ^ * $ “ in ein Forschungspapier ohne Methodik / Statistik. Wenn jemand „unvoreingenommenes Cohen“ sd „sagt, müssen Sie es einfach tun Nehmen Sie Ihre besten Vermutungen zu den beiden letzten (und ich denke, es könnte sogar eine andere Annäherung geben, die auch für Hedges $ g ^ * $ verwendet wurde!) .

Sie sind alle praktisch identisch, wenn $ n > 20 $ oder so, und alle können es sein auf die gleiche Weise interpretiert. Für alle praktischen Zwecke spielt es wahrscheinlich keine Rolle, welche Sie verwenden, es sei denn, Sie haben es mit wirklich kleinen Stichprobengrößen zu tun (obwohl Sie, wenn Sie auswählen können, auch die verwenden können, die ich Hedges g genannt habe) ist unvoreingenommen).

eferenzen: p

M. Borenstein, LV Hedges, JP Higgins, & Rothstein, HR (2011). Einführung in die Metaanalyse. West Sussex, Vereinigtes Königreich: John Wiley & Söhne.

Cohen, J. (1977). Statistische Leistungsanalyse für die Verhaltenswissenschaften (2. Aufl.). Hillsdale, NJ, USA: Lawrence Erlbaum Associates, Inc. Hedges, L. V. (1981). Verteilungstheorie für Glass Schätzer der Effektgröße und verwandte Schätzer. Journal of Educational Statistics, 6 (2), 107-128. Doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Statistische Methoden für die Metaanalyse. San Diego, CA: Academic Press

Antwort

Wenn Sie nur versuchen, das zu verstehen Grundbedeutung von Hedges „g, wie ich es bin, könnte dies auch hilfreich sein:

Die Größe von Hedges g kann mit Cohens interpretiert werden (1988 [2]) Konvention als klein (0,2), mittel (0,5) und groß (0,8). [1]

Ihre Definition ist kurz und klar:

Hedges g ist eine Variation von Cohen „sd, die Verzerrungen aufgrund kleiner Stichprobengrößen korrigiert (Hedges & Olkin, 1985).[1] Fußnote

Ich würde es begrüßen, wenn Statistikexperten dies bearbeiten, um dem kleinen (0,2) mittleren (0,5) und großen (0,8) wichtige Vorbehalte hinzuzufügen. behaupten, um Nichtfachleuten zu helfen, eine Fehlinterpretation von Hedges „g-Zahlen zu vermeiden, die in der sozialwissenschaftlichen und psychologischen Forschung verwendet werden.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Die Wirkung einer auf Achtsamkeit basierenden Therapie auf Angst und Depression: Eine metaanalytische Übersicht Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt und Diana Oh. J. Consult Clin Psychol. 2010 April ; 78 (2): 169–183. Doi: 10.1037 / a0018555

[2] Cohen J. Statistische Leistungsanalyse für die Verhaltenswissenschaften. 2. Aufl. Erlbaum; Hillsdale, NJ: 1988 (zitiert in [ 1])

Kommentare

  • +1. Betreff: klein-mittel-groß als 1. Durchgang, wenn Sie keine relevanten Kenntnisse oder Zusammenhänge haben Was auch immer, diese ‚ T-Shirt-Größen ‚ sind in Ordnung, aber in Wirklichkeit ist es ein kleiner oder großer Effekt variieren je nach Disziplin oder Thema. Nur weil ein Effekt ‚ groß ist ‚, bedeutet ‚ nicht unbedingt, dass er ‚ ist praktisch wichtig oder theoretisch sinnvoll.

Antwort

Die andere Plakate haben das Problem der Ähnlichkeiten und Unterschiede zwischen g und d behandelt. Einige Wissenschaftler sind der Meinung, dass die von Cohen angebotenen Werte für die Effektgröße viel zu großzügig sind, was zu einer Überinterpretation schwacher Effekte führt. Sie sind auch nicht an r gebunden, was zu der Möglichkeit führt, dass Wissenschaftler hin und her konvertieren, um günstigere interpretierbare Effektgrößen zu erhalten. Ferguson (2009, Professional Psychology: Research and PRactice) schlug vor, die folgenden Werte für die Interpretation von g zu verwenden:

.41 als empfohlenes Minimum für „praktische Bedeutung“. 1,15, mäßiger Effekt 2,70, starker Effekt

Diese sind offensichtlich strenger / schwieriger zu erreichen und nicht viele sozialwissenschaftliche Experimente werden zu starken Effekten führen … was wahrscheinlich auch so sein sollte.

Antwort

Bruce Thompson warnte davor, Cohens (0,2) so klein (0,5) wie mittel und (0,8) so groß zu verwenden Cohen hat nie beabsichtigt, diese als starre Interpretationen zu verwenden. Alle Effektgrößen müssen basierend auf dem Kontext der verwandten Literatur interpretiert werden. Wenn Sie die zu Ihrem Thema angegebenen verwandten Effektgrößen analysieren und sie sind (0,1) (0,3) ( 0,24) und Sie erzeugen einen Effekt von (0,4), dann kann dieser „groß“ sein. Wenn umgekehrt die gesamte verwandte Literatur Auswirkungen von (0,5) (0,6) (0,7) hat und Sie den Effekt von (0,4) haben, kann dies sein Ich weiß, dass dies ein triviales Beispiel ist, aber unbedingt wichtig. Ich glaube, Thompson hat einmal in einem Artikel gesagt: „Wir wären nur in einer anderen Metrik dumm“, wenn wir Interpretationen von e vergleichen Auswirkungen auf die Art und Weise, wie Sozialwissenschaftler zu dieser Zeit p-Werte interpretierten.

Antwort

Die Effektgröße ist ein Maß für die Assoziation Beschreiben Sie die Ergebnisse immer in Größenordnungen. Unser Studienergebnis muss nicht nur erkennen können, ob die Behandlung wirksam ist oder nicht, sondern auch, inwieweit sie wirksam ist. Hedges g und Cohen „sd sind unglaublich vergleichbar. Beide haben eine Aufwärtsveranlagung (eine Schwellung) in Nachwirkungen von bis zu etwa 4%. Die beiden Erkenntnisse sind grundsätzlich dieselben wie mit Ausnahme von Testgrößen unter 20, wenn Hedges „g schlägt Cohens d. Unterstützt“ g wird folglich ab und zu als Abhilfemaßnahme bezeichnet.

  • Für sehr kleine Stichprobengrößen (< 20) Wählen Sie Hedges g anstelle von Cohens d.
  • Bei Stichprobengrößen> 20 sind die Ergebnisse für beide Statistiken ungefähr gleich.

Sowohl Cohens d als auch Hedges g haben gleiche Interpretation:

  • Kleiner Effekt (mit bloßem Auge nicht erkennbar) = 0,2
  • Mittlerer Effekt = 0,5
  • Großer Effekt (sichtbar) mit bloßem Auge) = 0,8

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.