Pour une analyse de la taille de leffet, je remarque quil existe des différences entre Cohen « sd, Hedges » sg et Hedges « g *.

  • Ces trois mesures sont-elles normalement très similaires?
  • Dans quel cas ils produiraient des résultats différents?
  • Est-ce également une question de préférence que jutilise ou avec laquelle jutilise ou rapporte?

Commentaires

Réponse

Cohen » sd et Hedges «g pool de variances en supposant des variances de population égales, mais g pools utilisant n – 1 pour chaque échantillon au lieu de n, ce qui fournit une meilleure estimation, surtout si la taille des échantillons est petite. Les deux d et g sont quelque peu biaisés positivement, mais seulement de manière négligeable pour des échantillons de taille moyenne ou plus grande. Le biais est réduit en utilisant g *. Le d de Glass ne suppose pas des variances égales, il utilise donc le sd dun groupe de contrôle ou dun groupe de comparaison de base comme normalisateur pour la différence entre les deux moyennes.

Ces tailles deffet et Cliff « s et autres les tailles deffet non paramétriques sont discutées en détail dans mon livre:

Grissom, RJ, & Kim, J, J. (2005). Tailles deffet pour la recherche: A large approche pratique. Mahwah, NJ: Erlbaum.

Réponse

À ma connaissance, Hedges « sg est une version un peu plus précise de Cohen « sd (avec SD groupé) en ce que nous ajoutons un facteur de correction pour petit échantillon. Les deux mesures concordent généralement lorsque lhypothèse dhomoscédasticité nest pas violée, mais nous pouvons trouver des situations où ce nest pas le cas, voir par exemple McGrath & Meyer, Méthodes psychologiques 2006, 11 (4) : 386-401. Dautres articles sont listés à la fin de ma réponse.

Je généralement trouvé que dans presque toutes les études psychologiques ou biomédicales, cest le Cohen « s d qui est rapporté; cela découle probablement de la règle empirique bien connue pour interpréter son ampleur (Cohen, 1988). Je ne connais aucun article récent considérant le g de Hedges (ou Cliff delta comme alternative non paramétrique). Bruce Thompson a une version révisée de la section APA sur la taille de leffet.

En cherchant sur Google les études de Monte Carlo autour des mesures de taille deffet, jai trouvé ceci article qui pourrait être intéressant (je nai lu que le résumé et la configuration de la simulation): Intervalles de confiance robustes pour les tailles deffet: une étude comparative du d de Cohen et du delta de Cliff en cas de non-normalité et Variations hétérogènes (pdf).

À propos de votre deuxième commentaire, le package MBESS R comprend divers utilitaires pour le calcul ES (par exemple, smd et fonctions associées).

Autres références

  1. Zakzanis, KK (2001). Des statistiques pour dire la vérité, toute la vérité et rien que la vérité: formules, exemples numériques illustratifs et interprétation heuristique des analyses de taille deffet pour les chercheurs en neuropsychologie. Archives of Clinical Neuropsychology , 16 (7), 653-667.
  2. Durlak, J.A. (2009). Comment sélectionner, calculer et interpréter les tailles deffet. Journal of Pediatric Psychology

Commentaires

  • Un utilisateur anonyme a voulu ajouter la définition suivante de homoscédasticité pour ceux qui pourraient ne pas être familiers avec le terme:  » une propriété dun ensemble de variables aléatoires où chaque variable a la même variance finie « .

Réponse

Il semble que lorsque les gens disent Cohen « sd ils veulent surtout dire:

$$ d = \ frac {\ bar {x} _1 – \ bar {x} _2} {s} $$

$ s $ est lécart type regroupé,

$$ s = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2 – 2}} $$

Il y en a dautres estimateurs de lécart-type groupé, probablement les plus courants mis à part ce qui précède étant:

$$ s ^ * = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2}} $$

La notation ici est remarquablement incohérente, mais parfois les gens disent que la version $ s ^ * $ (cest-à-dire la version $ n_1 + n_2 $ ) est appelée Cohen « s $ d $ , et réserve le nom Hedge » s $ g $ pour le v ersion qui utilise $ s $ (cest-à-dire, avec la correction de Bessel, la version n1 + n2−2). Cest un peu étrange car Cohen a décrit les deux estimateurs pour lécart-type groupé (par exemple, version $ s $ p. 67, Cohen, 1977) avant que Hedges nécrive à leur sujet (Hedges, 1981).

Dautres fois Hedge « sg est réservé pour se référer à lune ou lautre des versions corrigées du biais dune différence moyenne standardisée développée par Hedges. Hedges (1981) a montré que Cohen » sd était biaisé à la hausse (cest-à-dire que sa valeur attendue est supérieure à la valeur réelle du paramètre de population), en particulier dans les petits échantillons, et a proposé un facteur de correction pour corriger le biais de Cohen « sd »:

Hedges « sg (lestimateur ):

$$ g = d * (\ frac {\ Gamma (df / 2)} {\ sqrt {df / 2 \,} \, \ Gamma ((df-1) / 2)}) $$ $ df = n_1 + n_2 -2 $ pour une conception de groupes indépendants, et $ \ Gamma $ est la fonction gamma (à lorigine Hedges 1981, cette version développée à partir de Hedges et Olkin 1985, p. 104)

Cependant, ce facteur de correction est assez complexe en termes de calcul, donc Hedges a également fourni une approximation triviale en termes de calcul qui, bien que légèrement biaisée, convient à presque toutes les fins imaginables:

Hedges «  $ g ^ * $ (lapproximation computationnelle triviale):

$$ g ^ * = d * ( 1 – \ frac {3} {4 (df) – 1}) $$ $ df = n_1 + n_2 -2 $ pour un groupe indépendant conception.

(Originaire de Hedges, 1981, cette version de Borenstein, Hedges, Higgins, & Rothstein, 2011, p. 27)

Mais, en ce qui concerne ce que les gens veulent dire quand ils disent Cohen « sd vs. Hedges » g contre g *, les gens semblent désigner lun de ces trois estimateurs comme Hedge « sg ou Cohen » sd de manière interchangeable, bien que je « nai jamais vu quelquun écrivez «  $ g ^ * $  » dans un document de recherche non méthodologique / statistique. Si quelquun dit « Cohen impartial » sd « , vous » allez simplement devoir faites de votre mieux pour lun des deux derniers (et je pense quil pourrait même y avoir une autre approximation qui a été utilisée pour Hedge « s $ g ^ * $ aussi!) .

Ils sont tous pratiquement identiques si $ n > 20 $ ou plus, et tous peuvent être interprété de la même manière. À toutes fins pratiques, à moins que vous nayez affaire à des échantillons de très petite taille, peu importe ce que vous utilisez (même si vous pouvez choisir, vous pouvez aussi bien utiliser celui que jai appelé Hedges, car il est impartiale).

Références :

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Introduction à la méta-analyse. West Sussex, Royaume-Uni: John Wiley & Sons.

Cohen, J. (1977). Analyse de puissance statistique pour les sciences du comportement (2e éd.). Hillsdale, NJ, États-Unis: Lawrence Erlbaum Associates, Inc.

Hedges, L. V. (1981). Théorie de la distribution pour l’estimateur de la taille de l’effet de Glass et les estimateurs connexes. Journal of Educational Statistics, 6 (2), 107-128. Doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Méthodes statistiques pour la méta-analyse. San Diego, Californie: Academic Press

Réponse

Si vous « essayez simplement de comprendre le signification de base de Hedges « g, comme je le suis, vous pourriez également trouver ceci utile:

La magnitude de Hedges g peut être interprétée en utilisant Cohen » s (1988 [2]) comme petite (0,2), moyenne (0,5) et grande (0,8). [1]

Leur définition est courte et claire:

Hedges g est une variante de Cohen « sd qui corrige les biais dus à la petite taille des échantillons (Hedges & Olkin, 1985).[1] note de bas de page

Japprécierais que les experts en statistiques le modifient pour ajouter des mises en garde importantes aux petites (0,2) moyennes (0,5) et grandes (0,8) prétention, pour aider les non-experts à éviter de mal interpréter les nombres « g de Hedges utilisés dans la recherche en sciences sociales et en psychologie.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Leffet de la thérapie basée sur la pleine conscience sur lanxiété et la dépression: une revue méta-analytique Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt et Diana Oh. J Consult Clin Psychol. 2010 Avril ; 78 (2): 169–183. Doi: 10.1037 / a0018555

[2] Cohen J. Statistical power analysis for the behavioral sciences. 2nd ed. Erlbaum; Hillsdale, NJ: 1988 (cité dans [ 1])

Commentaires

  • +1. Re: petit-moyen-grand, en 1ère passe, si vous navez pas de connaissances ou de contexte pertinents que ce soit, ces ‘ tailles de t-shirts ‘ sont correctes, mais en réalité, ce qui est petit ou grand effet sera varient selon la discipline ou le sujet. De plus, juste parce quun effet est ‘ grand ‘ ne ‘ le signifie nécessairement ‘ est pratiquement important ou théoriquement significatif.

Réponse

Le dautres affiches ont couvert la question des similitudes et des différences entre g et d. Pour ajouter à cela, certains chercheurs estiment que les valeurs de taille deffet proposées par Cohen sont beaucoup trop généreuses, ce qui conduit à une surinterprétation des effets faibles. Ils ne sont pas non plus liés à r, ce qui donne aux chercheurs la possibilité de faire des va-et-vient pour obtenir des tailles deffet interprétables plus favorablement. Ferguson (2009, Professional Psychology: Research and PRactice) a suggéré dutiliser les valeurs suivantes pour linterprétation de g:

.41, comme minimum recommandé pour la «signification pratique». 1.15, effet modéré 2.70, effet fort

Celles-ci sont évidemment plus rigoureuses / difficiles à réaliser et peu dexpériences en sciences sociales vont produire des effets puissants … ce qui devrait probablement être ainsi.

Réponse

Bruce Thompson a mis en garde contre lutilisation de Cohen « s (0,2) aussi petit (0,5) que moyen et (0,8) aussi grand . Cohen na jamais voulu les utiliser comme des interprétations rigides. Toutes les tailles deffet doivent être interprétées en fonction du contexte de la littérature connexe. Si vous analysez les tailles deffet liées rapportées sur votre sujet et quelles sont de (0,1) (0,3) ( 0,24) et vous produisez un effet de (0,4) alors cela peut être « grand ». Inversement, si toute la littérature connexe a des effets de (0,5) (0,6) (0,7) et que vous avez leffet de (0,4), cela peut être considéré comme petit. Je sais que cest un exemple trivial mais impérativement important. Je crois que Thompson a déclaré un jour dans un article: « Nous serions simplement stupides dans une métrique différente » en comparant les interprétations de e tailles adaptées à la manière dont les spécialistes des sciences sociales interprétaient les valeurs p à lépoque.

Réponse

La taille de leffet est une mesure dassociation, Décrivez toujours les résultats en termes de mesures de magnitude – le résultat de notre étude doit être capable de dire non seulement si le traitement est efficace ou non, mais dans quelle mesure il est efficace. Hedges g et Cohen « sd sont incroyablement comparables. Les deux ont une prédisposition à la hausse (un gonflement) dans des effets secondaires pouvant aller jusquà environ 4%. Les deux informations sont fondamentalement les mêmes que lorsque la taille des tests est inférieure à 20, lorsque Hedges « g bat Cohen » s d. Prend en charge « g est par conséquent appelé de temps en temps la taille dimpact corrigée.

  • Pour les échantillons de très petite taille (< 20) choisissez Hedges g plutôt que Cohens d.
  • Pour des tailles déchantillon> 20, les résultats des deux statistiques sont à peu près équivalents.

Le d de Cohen et Hedges g ont même interprétation:

  • Petit effet (ne peut pas être discerné à lœil nu) = 0,2
  • Effet moyen = 0,5
  • Grand effet (peut être vu à lœil nu) = 0,8

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *