Różnica między Cohenem ' sd i żywopłotami ' g dla metryk wielkości efektu

Jeśli chodzi o analizę wielkości efektu, zauważyłem, że istnieją różnice między Cohen „sd, Hedges” sg i Hedges „g *.

Czy te trzy wskaźniki są zwykle bardzo podobne?
Jaki byłby przypadek, w którym dałyby różne wyniki?
Czy jest to również kwestia preferencji, z której korzystam lub z którą zgłaszam?

Komentarze

Na wypadek, gdyby ' było przydatne dla potencjalnych odpowiedzi, tutaj wymienione są formuły: en.wikipedia.org/wiki/Effect_size
Symulacja w R z różnymi różnicami n1, n2, s1, s2 i populacji byłaby niezłym ćwiczeniem. Czy ktoś?
Ten materiał jest również omówiony tutaj: Jaka ' jest różnica między żywopłotami ' g i Cohen sd .

Odpowiedź

Zarówno Cohen” sd, jak i Hedges „g puli wariancji przy założeniu równych wariancji populacji, ale g puli przy użyciu n – 1 dla każdej próbki zamiast n, co zapewnia lepsze oszacowanie, zwłaszcza przy mniejszych wielkościach prób.” Zarówno d, jak i g są nieco dodatnio obciążone, ale tylko pomijalnie dla średnich lub większych rozmiarów próbek. Odchylenie zmniejsza się za pomocą g *. D by Glassa nie zakłada równych wariancji, więc używa sd grupy kontrolnej lub grupy porównawczej linii bazowej jako standaryzatora różnicy między dwiema średnimi.

Te wielkości efektów i Cliffa i inne rozmiary efektów nieparametrycznych są szczegółowo omówione w mojej książce:

Grissom, RJ, & Kim, J, J. (2005). Rozmiary efektów do badań: A szerokie podejście praktyczne. Mahwah, NJ: Erlbaum.

Odpowiedź

W moim rozumieniu, Hedges „sg jest nieco dokładniejszą wersją Cohena „sd (ze zbiorczym odchyleniem standardowym), ponieważ dodajemy współczynnik korygujący dla małej próby. Obie miary generalnie zgadzają się, gdy założenie o homoskedastyczności nie jest naruszane, ale możemy znaleźć sytuacje, w których tak nie jest, patrz np. McGrath & Meyer, Metody psychologiczne 2006, 11 (4) : 386-401 Inne artykuły są wymienione na końcu mojej odpowiedzi.

Ogólnie odkryli, że w prawie każdym studium psychologicznym lub biomedycznym jest to opisywane przez Cohena; wynika to prawdopodobnie z dobrze znanej praktycznej reguły dotyczącej interpretacji jej wielkości (Cohen, 1988). Nie wiem o żadnym niedawnym artykule, w którym rozważano by Hedgesa (lub Cliff delta jako nieparametryczną alternatywę). Bruce Thompson ma poprawioną wersję sekcji APA na temat wielkości efektu.

Szukając w Google badań Monte Carlo dotyczących miar wielkości efektu, znalazłem to artykuł, który może być interesujący (czytam tylko streszczenie i konfigurację symulacji): Solidne przedziały ufności dla wielkości efektu: A Comparative Study of Cohens d and Cliffs Delta Under Non-normalality and Odmiany heterogeniczne (pdf).

Jeśli chodzi o Twój drugi komentarz, pakiet MBESS R zawiera różne narzędzia do obliczania ES (np. smd i powiązane funkcje).

Inne odniesienia

Zakzanis, KK (2001). Statystyki mówią prawdę, całą prawdę i tylko prawdę: wzory, ilustrujące przykłady liczbowe i heurystyczna interpretacja analiz wielkości efektu dla badaczy neuropsychologicznych. Archives of Clinical Neuropsychology , 16 (7), 653-667.
Durlak, J.A. (2009). Jak wybierać, obliczać i interpretować rozmiary efektów. Journal of Pediatric Psychology

Komentarze

Anonimowy użytkownik chciał dodać następującą definicję homoskedastyczność dla tych, którzy mogą nie być zaznajomieni z terminem: ” właściwość zbioru zmiennych losowych, gdzie każda zmienna ma ta sama skończona wariancja „.

Odpowiedź

Wydaje się, że kiedy ludzie mówią Cohen „sd, mają na myśli głównie:

$$ d = \ frac {\ bar {x} _1 – \ bar {x} _2} {s} $$

Gdzie $ s $ to zebrane odchylenie standardowe,

$$ s = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2 – 2}} $$

Istnieją inne estymatory zbiorczego odchylenia standardowego, prawdopodobnie najpowszechniejsze poza powyższym to:

$$ s ^ * = \ sqrt {\ frac {\ sum (x_1 – \ bar {x} _1) ^ 2 + (x_2 – \ bar {x} _2) ^ 2} {n_1 + n_2}} $$

Notacja tutaj jest wyjątkowo niespójna, ale czasami ludzie mówią, że $ s ^ * $ (tj. wersja $ n_1 + n_2 $ ) nazywa się Cohen „s $ d $ i zarezerwuj nazwę Hedge” s $ g $ dla v wersja wykorzystująca $ s $ (tj. z poprawką Bessela, wersja n1 + n2−2). To trochę dziwne, ponieważ Cohen nakreślił oba estymatory dla połączonego odchylenia standardowego (np. $ s $ wersja na str. 67, Cohen, 1977), zanim Hedges o nich napisał (Hedges, 1981).

Innym razem Hedge „sg jest zarezerwowane, aby odnosić się do dowolnej z wersji znormalizowanej średniej różnicy, którą opracował Hedges, skorygowanej uprzedzeniem. Hedges (1981) wykazał, że Cohen” sd był tendencyjny w górę (tj. jego oczekiwana wartość jest wyższa niż rzeczywista wartość parametru populacji), szczególnie w małych próbach, i zaproponowano współczynnik korygujący, aby skorygować odchylenie Cohena „sd”:

Hedges sg (nieobciążony estymator ):

$$ g = d * (\ frac {\ Gamma (df / 2)} {\ sqrt {df / 2 \,} \, \ Gamma ((df-1) / 2)}) $$ gdzie $ df = n_1 + n_2 -2 $ dla projektu niezależnych grup i $ \ Gamma $ to funkcja gamma. (pierwotnie Hedges 1981, ta wersja opracowana na podstawie Hedges and Olkin 1985, s. 104)

Jednak ten współczynnik korygujący jest dość złożony obliczeniowo, więc Hedges dostarczył również obliczeniowo trywialne przybliżenie, które, choć wciąż nieznacznie obciążone, jest odpowiednie dla prawie wszystkich możliwych celów:

Hedges „ $ g ^ * $ (obliczeniowo trywialne przybliżenie):

$$ g ^ * = d * ( 1 – \ frac {3} {4 (df) – 1}) $$ Gdzie $ df = n_1 + n_2 -2 $ dla niezależnych grup projekt.

(pochodzi z Hedges, 1981, ta wersja z Borenstein, Hedges, Higgins, & Rothstein, 2011, s. 27)

Ale jeśli chodzi o to, co ludzie mają na myśli, gdy mówią Cohen „sd vs. Hedges” g vs. g *, ludzie wydają się odnosić zamiennie do któregokolwiek z tych trzech estymatorów jako Hedge „sg lub Cohen” sd, chociaż nigdy nikogo nie widziałem napisz „ $ g ^ * $ ” w artykule badawczym niezwiązanym z metodologią / statystykami. Jeśli ktoś powie „bezstronny Cohen” sd „,” będziesz musiał po prostu zgadnij jak najlepiej w którymkolwiek z dwóch ostatnich (i myślę, że może być nawet inne przybliżenie, które zostało użyte dla Hedge „s $ g ^ * $ !) .

Wszystkie są praktycznie identyczne, jeśli $ n > 20 $ lub więcej, i wszystkie mogą być interpretowane w ten sam sposób. Ze wszystkich praktycznych powodów, chyba że masz do czynienia z naprawdę małymi rozmiarami próbek, prawdopodobnie nie ma znaczenia, którego użyjesz (chociaż jeśli możesz wybrać, równie dobrze możesz użyć tego, który nazwałem Hedges ”g, ponieważ jest bezstronny).

Odniesienia :

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Wprowadzenie do metaanalizy. West Sussex, Wielka Brytania: John Wiley & Sons.

Cohen, J. (1977). Statystyczna analiza mocy dla nauk behawioralnych (wyd. 2). Hillsdale, NJ, USA: Lawrence Erlbaum Associates, Inc.

Hedges, L. V. (1981). Distribution Theory for Glasss Estimator of Effect size and Related Estimators. Journal of Educational Statistics, 6 (2), 107-128. Doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Statystyczne metody metaanalizy. San Diego, Kalifornia: Academic Press

Odpowiedź

Jeśli „po prostu próbujesz zrozumieć podstawowe znaczenie Hedges „g, tak jak ja, może ci się również przydać pomoc:

Wielkość g Hedgesa może być zinterpretowana przy użyciu s Cohena (1988 [2]) jako mały (0,2), średni (0,5) i duży (0,8). [1]

Ich definicja jest krótka i jasna:

Żywopłoty g jest odmianą Cohena „sd, która koryguje odchylenia z powodu małych rozmiarów prób (Hedges & Olkin, 1985).[1] przypis

Byłbym wdzięczny ekspertom ds. Statystyki za edycję tego, aby dodać wszelkie ważne zastrzeżenia do małych (0,2) średnich (0,5) i dużych (0,8) twierdzą, aby pomóc żadnym ekspertom uniknąć błędnej interpretacji liczb Hedgesa używanych w badaniach społecznych i psychologicznych.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Wpływ terapii opartej na uważności na lęk i depresję: przegląd metaanalityczny Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt i Diana Oh. J Consult Clin Psychol. 2010 kwiecień 78 (2): 169–183. Doi: 10.1037 / a0018555

[2] Cohen J. Statistical power analysis for the Behavioral sciences, wyd. 2 Erlbaum; Hillsdale, NJ: 1988 (cytowane w [ 1])

Komentarze

+1. Re: mały-średni-duży, jako pierwszy przebieg, jeśli nie masz odpowiedniej wiedzy lub kontekstu w każdym razie te ' rozmiary t-shirtów ' są w porządku, ale w rzeczywistości mały lub duży efekt różnią się w zależności od dyscypliny lub tematu. Co więcej, sam fakt, że efekt jest ' duży ', nie oznacza ' nie musi oznaczać, że ' jest praktycznie ważny lub teoretycznie znaczący.

Odpowiedź

inne plakaty poruszały kwestię podobieństw i różnic między g i d. Aby dodać do tego, niektórzy uczeni uważają, że wartości wielkości efektu oferowane przez Cohena są zbyt hojne, co prowadzi do nadinterpretacji słabych efektów. Nie są również powiązane z r, co prowadzi do możliwości, że uczeni mogą przechodzić w tę iz powrotem, aby uzyskać bardziej korzystne interpretowalne rozmiary efektów. Ferguson (2009, Professional Psychology: Research and PRactice) zasugerował użycie następujących wartości do interpretacji g:

0,41, jako zalecane minimum dla „znaczenia praktycznego”. 1.15, umiarkowany efekt 2.70, mocny efekt

Są one oczywiście bardziej rygorystyczne / trudne do osiągnięcia i niewiele eksperymentów w naukach społecznych nie przyniesie silnych efektów … i prawdopodobnie tak powinno być.

Odpowiedź

Bruce Thompson ostrzegał przed użyciem Cohena (0,2) jako małego (0,5) jako średniego i (0,8) jako dużego . Cohen nigdy nie zamierzał używać ich jako sztywnych interpretacji. Wszystkie wielkości efektów należy interpretować w oparciu o kontekst powiązanej literatury. Jeśli analizujesz powiązane wielkości efektów zgłoszone na Twój temat i wynoszą one (0,1) (0,3) ( 0,24) i uzyskasz efekt (0,4), wtedy może on być „duży”. I odwrotnie, jeśli cała powiązana literatura ma efekty (0,5) (0,6) (0,7) i efekt (0,4) może być uważane za małe. Wiem, że jest to trywialny przykład, ale bezwzględnie ważny. Myślę, że Thompson stwierdził kiedyś w artykule: „Bylibyśmy po prostu głupi w innej metryce”, porównując interpretacje e odpowiednie rozmiary do tego, jak socjolodzy interpretowali wartości p w tamtym czasie.

Odpowiedź

Wielkość efektu jest miarą asocjacji, powinniśmy zawsze opisuj wyniki za pomocą miar wielkości – wynik naszego badania musi być w stanie powiedzieć nie tylko, czy leczenie jest skuteczne, czy nie, ale także, jak bardzo jest skuteczne. G i Cohena sd żywopłotów są niewiarygodnie porównywalne. Oba mają predyspozycje do wzrostu (obrzęk) w następstwie do około 4%. Te dwa spostrzeżenia są zasadniczo takie same, jak z wyjątkiem sytuacji, gdy rozmiary testowe są poniżej 20, gdy żywopłoty „g bije d. Cohena” d. Obsługuje ”g jest od czasu do czasu nazywane rozmiarem naprawionego wpływu.

W przypadku bardzo małych próbek (< 20) wybierz wartość g Hedgesa zamiast d Cohena.
Dla wielkości próby> 20 wyniki dla obu statystyk są z grubsza równoważne.

Zarówno d Cohena, jak i g Hedges mają ta sama interpretacja:

Mały efekt (niewidoczny gołym okiem) = 0,2
Średni efekt = 0,5
Duży efekt (można zobaczyć gołym okiem) = 0,8

Komentarze

Odpowiedź

Odpowiedź

Komentarze

Odpowiedź

Odpowiedź

Komentarze

Odpowiedź

Odpowiedź

Odpowiedź

Dodaj komentarz Anuluj pisanie odpowiedzi