効果量分析では、Cohen “sd、Hedges” sg、Hedges “g *の間に違いがあることに気づいています。

  • これらの3つの指標は通常、非常に似ていますか?
  • 異なる結果が得られる場合はどうなりますか?
  • また、私が使用または報告するのは好みの問題ですか?

コメント

  • 'が潜在的な回答者の公式に役立つ場合は、次のリストに記載されています:en.wikipedia.org/wiki/Effect_size
  • n1、n2、s1、s2、および人口の違いを変化させたRでのシミュレーションは、すばらしい演習になります。誰か?
  • この資料についてもここで説明します:ヘッジの違い' ' gとコーエン sd

回答

コーエンのsdとヘッジの両方”gプールの分散は、母分散が等しいと仮定していますが、gプールはnではなく各サンプルにn -1を使用します。これにより、特にサンプルサイズが小さいほど、より良い推定値が得られます。 dとgはどちらもやや正のバイアスがかかっていますが、中程度以上のサンプルサイズでは無視できる程度です。 g *を使用してバイアスを減らします。 d by Glassは等分散を想定していないため、2つの平均の差の標準化としてコントロールグループまたはベースライン比較グループのsdを使用します。

これらの効果量とクリフなどノンパラメトリック効果量については、私の本で詳しく説明しています:

Grissom、RJ、& Kim、J、J。(2005)。研究の効果量:A幅広い実用的なアプローチ。NJ、Mahwah:Erlbaum。

回答

私の理解では、Hedges “sgはやや正確なバージョンです。小さなサンプルの補正係数を追加するという点で、Cohen “sd(プールされたSDを使用)の。ホモセダスティック性の仮定に違反していない場合、両方の測定値は一般に一致しますが、そうでない状況が見つかる場合があります。 = “f762be2100″>

Meyer、 Psychological Methods 2006、 11(4) :386-401。他の論文は私の返信の最後にリストされています。

私は一般的にほとんどすべての心理学または生物医学の研究で、これが報告されているコーエンのdであることがわかりました。これはおそらく、その大きさを解釈するためのよく知られた経験則に基づいています(Cohen、1988)。ヘッジのg(またはノンパラメトリックな代替案としてのクリフデルタ)を考慮した最近の論文については知りません。 Bruce Thompsonは、効果量に関するAPAセクションの改訂版を持っています。

効果量の測定に関するモンテカルロ研究について調べたところ、これが見つかりました。興味深いかもしれない論文(私は要約とシミュレーションのセットアップのみを読みました):効果量のロバストな信頼区間:非正規性の下でのコーエンのdとクリフのデルタの比較研究と不均一分散(pdf)。

2番目のコメントについて、MBESS Rパッケージには、ES計算用のさまざまなユーティリティが含まれています(例:smdおよび関連する関数)。

その他の参照

  1. Zakzanis、KK (2001)。真実、真実全体、そして真実以外の何物でもない統計:神経心理学研究者のための公式、例示的な数値例、および効果量分析の発見的解釈。 Archives of Clinical Neuropsychology 、16(7)、653-667。
  2. Durlak、J.A。 (2009)。効果量を選択、計算、および解釈する方法。 Journal of Pediatric Psychology

コメント

  • 匿名ユーザーが、次の

等分散性という用語に慣れていない可能性がある場合:"各変数が持つ確率変数のセットのプロパティ同じ有限分散"。

回答

人々がコーエンと言うとき、彼らは主に次のことを意味しているようです:

$$ d = \ frac {\ bar {x} _1- \ bar {x} _2} {s} $$

ここで $ s $ は、プールされた標準偏差です。

$$ s = \ sqrt {\ frac {\ sum (x_1- \ bar {x} _1)^ 2 +(x_2- \ bar {x} _2)^ 2} {n_1 + n_2-2}} $$

他にもありますプールされた標準偏差の推定値。おそらく上記以外で最も一般的なものは次のとおりです。

$$ s ^ * = \ sqrt {\ frac {\ sum(x_1 -\ bar {x} _1)^ 2 +(x_2- \ bar {x} _2)^ 2} {n_1 + n_2}} $$

ここでの表記は著しく一貫性がありませんが、 $ s ^ * $ (つまり、 $ n_1 + n_2 $ バージョン)と言われることもあります。バージョンはコーエンの $ d $ と呼ばれ、ヘッジの $ g $ という名前を予約します。 v $ s $ を使用するバージョン(つまり、Besselの修正により、n1 + n2-2バージョン)。コーエンがプールされた標準偏差の両方の推定量を概説したので、これは少し奇妙です(たとえば、 $ s $ バージョン(p。67、コーエン、1977))。 (Hedges、1981)。

また、Hedge “sgは、Hedgesが開発した標準化された平均差のバイアス補正バージョンのいずれかを指すために予約されています。Hedges(1981)は、Cohen” sdが上向きにバイアスされていることを示しました。 (つまり、その期待値は真の母集団パラメーター値よりも高い)、特に小さなサンプルでは、コーエンの「sd」バイアスを補正するための補正係数を提案しました。

ヘッジスg(バイアスのない推定量) ):

$$ g = d *(\ frac {\ Gamma(df / 2)} {\ sqrt {df / 2 \、} \、\ Gamma((df-1)/ 2)})$$ ここで、 $ df = n_1 + n_2 -2 $ は独立したグループの設計であり、 $ \ Gamma $ はガンマ関数です(元々はHedges 1981、このバージョンはHedges and Olkin 1985、p。104から開発されました)

ただし、この補正係数は計算上かなり複雑であるため、ヘッジは計算上簡単な近似も提供します。これは、わずかに偏っていますが、考えられるほとんどすべての目的に適しています。

ヘッジ “ $ g ^ * $ (計算上簡単な近似):

$$ g ^ * = d *( 1- \ frac {3} {4(df)-1})$$ ここで、独立したグループの場合は $ df = n_1 + n_2 -2 $ 設計。

(元々はHedges、1981年、このバージョンはBorenstein、Hedges、Higgins、& Rothstein、2011年、27ページから)

しかし、人々がCohen “sd vs. Hedges” g vs. g *と言うときの意味については、私は誰かを見たことがないのに、これら3つの推定量のいずれかをHedge “sgまたはCohen” sdと同じ意味で呼んでいるようです。方法論/統計以外の研究論文に「 $ g ^ * $ 」と書いてください。誰かが「偏りのないコーエン」sdと言った場合、あなたは「最後の2つのいずれかを最もよく推測してください(そして、ヘッジの $ g ^ * $ にも使用されている別の近似値があるかもしれません!) 。

$ n > 20 $ 程度の場合、これらはすべて実質的に同一であり、すべて同じように解釈されます。すべての実用的な目的で、「非常に小さいサンプルサイズを扱っている場合を除いて、どちらを使用するかはおそらく問題ではありません(ただし、選択できる場合は、私が「ヘッジ」と呼んでいるものを使用することもできます)。

参照:

Borenstein、M.、Hedges、LV、Higgins、JP、& Rothstein、HR(2011)。メタアナリシス入門。イギリス、ウエストサセックス:ジョンワイリー&息子。

コーエンJ.(1977)。行動科学の統計的検出力分析(第2版)。米国ニュージャージー州ヒルズデール:Lawrence Erlbaum Associates、Inc。

Hedges、L。V.(1981)。 Glassの効果量の推定量と関連する推定量の分布理論。JournalofEducationalStatistics、6(2)、107-128。doi:10.3102 / 10769986006002107

Hedges LV、Olkin I.(1985)。メタ分析の統計的手法。カリフォルニア州サンディエゴ:アカデミックプレス

回答

理解しようとしているだけの場合ヘッジの基本的な意味 “g、私がそうであるように、これも役立つかもしれません:

ヘッジのgの大きさは、コーエンを使用して解釈できます。 (1988 [2])小(0.2)、中(0.5)、および大(0.8)としての規則。 [1]

それらの定義は短く明確です:

ヘッジ gは、サンプルサイズが小さいことによるバイアスを修正するCohen “sdのバリエーションです(Hedges & Olkin、1985)。[1]脚注

統計の専門家がこれを編集して、小(0.2)中(0.5)と大(0.8)に重要な警告を追加していただければ幸いです。主張、非専門家が社会科学および心理学の研究で使用されるヘッジのg番号を誤解しないようにするため。

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ マインドフルネスベースの治療が不安とうつ病に及ぼす影響:メタアナリシスレビューStefan G. Hofmann、Alice T. Sawyer、Ashley A. Witt、DianaOh。JConsultClinPsychol。2010年4月; 78(2):169–183。doi:10.1037 / a0018555

[2] CohenJ。行動科学の統計的パワー分析。第2版Erlbaum; Hillsdale、NJ:1988([ 1])

コメント

  • +1。Re:関連する知識やコンテキストがない場合は、1回目のパスとして小-中-大いずれにせよ、これらの' Tシャツのサイズ'は問題ありませんが、実際には、小さな効果または大きな効果は何でしょうか。分野やトピックによって異なります。さらに、効果が'大きい'であるからといって'必ずしもそれを意味するわけではありません'は実用的に重要または理論的に意味があります。

回答

他のポスターは、gとdの類似点と相違点の問題を取り上げています。これに加えて、一部の学者は、コーエンによって提供された効果量の値があまりにも寛大であり、弱い効果の過剰な解釈につながると感じています。それらはまた、学者がより有利に解釈可能な効果量を得るために前後に変換する可能性につながるrに結び付けられていません。 Ferguson(2009、Professional Psychology:Research and PRactice)は、gの解釈に次の値を使用することを提案しました:

.41、「実用的有意性」の推奨最小値として。 1.15、中程度の効果2.70、強い効果

これらは明らかに達成するのがより厳密で困難であり、多くの社会科学実験が強い効果を得る予定はありません…おそらくそうあるべきです。

回答

ブルース・トンプソンは、コーエンの(0.2)を中程度、(0.8)を大きく使用することについて警告しました。コーエンは、これらが厳密な解釈として使用されることを決して意図していませんでした。すべての効果量は、関連文献の文脈に基づいて解釈する必要があります。トピックで報告された関連する効果量を分析している場合、それらは(0.1)(0.3)( 0.24)そしてあなたが(0.4)の効果を生み出すなら、それは「大きい」かもしれません。逆に、すべての関連文献が(0.5)(0.6)(0.7)の効果を持ち、あなたが(0.4)の効果を持っているなら、それは小さいと考えられます。これは些細な例ですが、絶対に重要です。トンプソンはかつて、eの解釈を比較するときに、「異なるメトリックでは単に愚かである」と論文で述べたと思います。社会科学者が当時のp値をどのように解釈していたかに対する効果量。

回答

効果量は関連性の尺度であり、結果は常に大きさの尺度で説明してください。私たちの研究結果は、治療が効果的かどうかだけでなく、どれだけ効果的かを知ることができなければなりません。 HedgesのgとCohen “sdは非常に類似しています。どちらも、後遺症で最大約4%の上向きの素因(腫れ)があります。2つの洞察は、テストサイズが20未満の場合を除いて、基本的に同じです。その結果、「gはコーエンのd。サポートを打ち負かします」gは、改善された影響サイズと呼ばれることがあります。

  • サンプルサイズが非常に小さい場合(< 20)コーエンのdよりもヘッジのgを選択します。
  • サンプルサイズが20を超える場合、両方の統計の結果はほぼ同等です。

コーエンのdとヘッジgの両方が同じ解釈:

  • 小さな効果(肉眼では識別できない)= 0.2
  • 中程度の効果= 0.5
  • 大きな効果(見ることができる)肉眼で)= 0.8

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です