Discutarea noii întrebări:
De exemplu, dacă vreau să studiez dimensiunea corpului uman și constat că dimensiunea corpului uman adult are un standard o abatere de 2 cm, probabil aș deduce că dimensiunea corpului uman adult este foarte uniformă
Depinde de ceea ce comparăm. Cu ce standard de comparație care face acest lucru foarte uniform? Dacă îl comparați cu variabilitatea lungimilor șuruburilor pentru un anumit tip de șurub care ar putea fi extrem de variabil.
în timp ce o abatere standard de 2 cm în mărimea șoarecilor ar însemna că șoarecii diferă surprinzător de mult în ceea ce privește dimensiunea corpului.
Prin comparație cu același lucru în exemplul tău de oameni mai uniformi, cu siguranță; atunci când vine vorba de lungimi de lucruri, care nu pot fi decât pozitive, probabil că are mai mult sens să comparăm coeficientul de variație (așa cum subliniez în răspunsul meu original), ceea ce este același lucru cu compararea sd pentru a însemna că sugerezi aici .
Evident, sensul abaterii standard este relația sa cu media,
Nu, nu întotdeauna. În cazul mărimilor lucrurilor sau cantităților de lucruri (de exemplu, tonajul de cărbune, volumul de bani), acest lucru are adesea sens, dar în alte contexte, nu are sens să ne comparăm cu media.
Chiar și atunci, ele nu sunt neapărat comparabile de la un lucru la altul. Nu există nici un standard aplicabil la toate lucrurile. cât de variabilă este ceva înainte de variabila sa.
și o abatere standard în jurul unei zecimi din medie nu este remarcabilă (de exemplu, pentru IQ: SD = 0,15 * M).
Ce lucruri comparăm aici? Lungimi cu IQ ? De ce are sens să comparăm un set de lucruri cu altul? Rețineți că alegerea mediei 100 și sd 15 pentru un tip de test IQ este complet arbitrară. Nu au unități. Ar putea fi la fel de ușor să fie 0 sd 1 sau 0.5 și sd 0.1.
Dar ce este considerat „mic” și ce este „mare”, când vine vorba de relația dintre deviația standard și medie?
Acoperit deja în răspunsul meu original, dar mai elocvent acoperit în comentariul whuberului – nu există un standard și nu se poate fii.
Unele dintre punctele mele despre Cohen acolo se aplică în continuare în acest caz (sd relativ la medie este cel puțin fără unitate); dar chiar și cu ceva de genul spune Cohen „s d, un standard adecvat într-un context nu este neapărat potrivit în altul.
Răspunsuri la o versiune anterioară
Calculăm și raportăm întotdeauna mijloacele și abaterile standard.
Ei bine, poate de multe ori; Nu știu că întotdeauna o fac. Există cazuri în care nu este atât de relevant.
Dar ce înseamnă de fapt dimensiunea varianței?
Abaterea standard este un fel de distanță * medie față de medie. Varianța este pătratul abaterea standard. Abaterea standard se măsoară în aceleași unități ca datele; varianța este în unități pătrate.
* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )
Vă spun ceva despre modul în care sunt„ răspândite ”datele (sau distribuția, în cazul în care„ calculați sd sau varianța o distribuție).
De exemplu, să presupunem că observăm ce loc ocupă oamenii într-o cameră goală. Dacă observăm că majoritatea oamenilor stau aproape de fereastră cu puțină variație,
Nu este exact un caz de înregistrare „care loc”, ci înregistrarea „distanței față de fereastră”. (Știind că „majoritatea stau aproape de fereastră” nu îți spune neapărat nimic despre medie și nici variația despre medie. Ceea ce îți spune este că mediana distanța de fereastră trebuie să fie mică.)
putem presupune că acest lucru înseamnă că oamenii preferă, în general, să se așeze lângă fereastră și să aibă o vedere sau suficientă lumină este principalul factor motivant în alegerea unui loc.
Că mediana este mică nu vă spune de la sine. S-ar putea să o deduceți din alte considerații, dar pot exista tot felul de motive pentru care că nu putem discerne în niciun fel de date.
Dacă, pe de altă parte, observăm că, în timp ce cea mai mare proporție stă aproape de fereastră există o mare diferență cu alte locuri ocupate deseori (de exemplu, mulți stau aproape de ușă, alții stau aproape de distribuitorul de apă sau de ziare), am putea presupune că, deși mulți oameni preferă să stea aproape de fereastră, pare fiți mai mulți factori decât lumina sau vizualizarea care influențează alegerea locurilor și preferințele diferite ale diferitelor persoane.
Din nou, aduceți informații în afara datelor; s-ar putea să se aplice sau s-ar putea să nu fie. Pentru toți știm că lumina este mai bine departe de fereastră, deoarece ziua este acoperită de nori sau jaluzelele sunt trase.
La ce valori c o spunem că comportamentul pe care l-am observat este foarte variat (diferiților oameni le place să stea în locuri diferite)?
Ceea ce face ca deviația standard să fie mare sau mică nu este determinată de unele standarde externe, ci de considerente de obiect și, într-o anumită măsură, cu ce faceți datele și chiar factorii personali.
Cu toate acestea, cu măsurători pozitive, cum ar fi distanțele, este uneori relevant să se ia în considerare abaterea standard în raport cu media (coeficientul de variație); este încă arbitrar, dar distribuțiile cu coeficienți de variație mult mai mici decât 1 (deviația standard mult mai mică decât media) sunt „diferite” într-un anumit sens decât cele în care este mult mai mare decât 1 (deviația standard mult mai mare decât media , care deseori vor avea tendința de a fi extrem de dreaptă).
Și când putem deduce că comportamentul este în mare parte uniform (tuturor le place să stea la fereastră)
Aveți grijă să folosiți cuvântul „uniform” în acest sens, deoarece este ușor să vă interpretați greșit sensul (de exemplu, dacă spun că oamenii sunt ” așezat uniform în jurul camerei „asta înseamnă aproape opusul a ceea ce vrei să spui). Mai general, atunci când discutați despre statistici, evitați, în general, să folosiți termeni de jargon în sensul lor obișnuit.
și mica variație pe care o arată datele noastre este în mare parte rezultatul efectelor aleatorii sau a variabilelor confuze (murdărie pe un scaun, soarele mișcându-se și mai multă umbră în spate etc.)?
Nu, din nou, aduceți informații externe la cantitatea statistică pe care o discutați. Varianța nu vă spune așa ceva.
Există linii directoare pentru evaluarea magnitudinii varianței datelor, similar cu liniile directoare ale lui Cohen pentru interpretarea dimensiunii efectului (o corelație de 0,5 este mare, 0,3 este moderat și 0,1 este mic)?
Nu în general, nu.
-
Cohen „s discuția [1] asupra dimensiunilor efectului este mai nuanțată și situațională decât indicați; el oferă un tabel cu 8 valori diferite, mici și mijlocii, în funcție de ce fel de lucru este discutat. Acele numere pe care le dați se aplică diferențelor de mijloace independente (dimensiunile efectului lui Cohen d).
-
Dimensiunile efectului lui Cohen sunt scalate pentru a fi cantități fără unități . Abaterea standard și varianța nu sunt – schimbați unitățile și ambele se vor schimba.
-
Dimensiunile efectului lui Cohen sunt destinate aplicării într-o anumită zonă de aplicație (și chiar și atunci consider se concentrează prea mult asupra acelor standarde care sunt mici, medii și mari, atât oarecum arbitrare, cât și oarecum mai prescriptive decât aș dori). Ele sunt mai mult sau mai puțin rezonabile pentru domeniul de aplicare prevăzut, dar pot fi complet inadecvate în alte domenii (fizica cu energie ridicată, de exemplu, necesită frecvent efecte care să acopere multe erori standard, dar echivalenții ohenens dimensiuni ale efectului pot fi mai multe ordine de mărime decât ceea ce este posibil).
De exemplu, dacă 90% (sau doar 30%) din observații se încadrează într-o abatere standard față de medie, este ceva neobișnuit sau complet neremarcabil ?
Ah, rețineți că ați încetat să discutați dimensiunea deviației standard / varianței și ați început să discutați Proporția de observații într-o abatere standard a mediei, un concept complet diferit. Foarte grosolan vorbind, acest lucru este mai mult legat de vârful distribuției.
De exemplu, fără a modifica deloc varianța, pot schimba proporția unei populații în limita a 1 sd din medie. Dacă populația are o distribuție de $ t_3 $, aproximativ 94% din aceasta se află la 1 sd de medie, dacă are o distribuție uniformă, aproximativ 58% se află la 1 sd de medie; și cu o distribuție beta ($ \ frac18, \ frac18 $), este de aproximativ 29%; acest lucru se poate întâmpla cu toți aceiași abateri standard, sau cu oricare dintre ei mai mari sau mai mici fără a schimba procentele – nu este deloc legat de răspândire, pentru că ați definit intervalul în termeni de deviație standard.
[1]: Cohen J. (1992),
„A power primer”,
Psychol Bull. , 112 (1), iulie: 155-9.
Comentarii
De Chebyshev inegalitate știm că probabilitatea ca aproximativ $ x $ să fie $ k $ ori $ \ sigma $ din medie este cel mult $ \ frac {1} {k ^ 2} $:
$$ \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$
Cu toate acestea, făcând unele ipoteze de distribuție, puteți fi mai precis, de exemplu, Normal aproximarea duce la 68-95-99.7 regulă . În general, utilizând orice funcție de distribuție cumulativă puteți alegeți un anumit interval care ar trebui să cuprindă un anumit procent de cazuri. Cu toate acestea, alegerea lățimii intervalului de încredere este o decizie subiectivă așa cum s-a discutat în acest fir .
Exemplu
Cel mai intuitiv exemplu care îmi vine în minte este scara inteligență . Inteligența este ceva care nu poate fi măsurat direct, noi nu au „unități” directe de inteligență (apropo, centimetri sau grade Celsius sunt, de asemenea, cumva arbitrare). Testele de informații sunt punctate astfel încât să aibă media de 100 și abaterea standard de 15. Ce ne spune? Cunoscând media și deviația standard, putem deduce cu ușurință ce scoruri pot fi considerate „scăzute”, „medii” sau „ridicate”. Ca „medie” putem clasifica astfel de scoruri obținute de majoritatea oamenilor (să zicem 50%), scorurile mai mari pot fi clasificate ca „peste medie”, scorurile neobișnuit de mari pot fi clasificate ca „superioare” etc., acest lucru se traduce în tabelul de mai jos .
Wechsler (WAIS – III) 1997 Clasificare test IQ Interval IQ („deviație IQ”)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low
(Sursa: https://en.wikipedia.org/wiki/IQ_classification )
Deci, abaterea standard ne spune cât de departe putem presupune că valorile individuale sunt îndepărtate de medie. Vă puteți gândi la $ \ sigma $ ca la distanța fără unitate de medie. Dacă vă gândiți la scoruri observabile, spuneți scorurile testelor de inteligență, decât cunoașterea abaterilor standard vă permite să deduceți cu ușurință cât de mult (câte $ \ sigma $ „s) depinde o anumită valoare de medie și deci cât de comună sau mai puțin frecventă este. Este subiectiv câți $ \ sigma $ „califică drept” departe „, dar acest lucru poate fi ușor calificat gândind în termeni de probabilitate de a observa valori care se află la o anumită distanță de medie.
Acest lucru este evident dacă uită-te la ce varianță ($ \ sigma ^ 2 $) este
$$ \ operatorname {Var} (X) = \ operatorname {E} \ left [(X – \ mu) ^ 2 \ right] . $$
… distanța (medie) așteptată de $ X $ „s de la $ \ mu $. Dacă vă întrebați, decât aici puteți citi de ce este pătrat .
Comentarii