Mitä keskihajonnan koko tarkoittaa? [kaksoiskappale]

Tähän kysymykseen on jo saatu vastauksia :

Kommentit

Haluaisin ehdottaa, että näihin kysymyksiin voidaan saada huomattava käsitys korvaamalla " varianssi " tai " keskihajonta " jollakin muulla (tutumalla) määrällä, jolla on analoginen rooli kvantitatiivisessa kuvauksessa, kuten pituus. Kuvatessaan useimpia fyysisiä esineitä tutkijat ilmoittavat pituuden. Mitä pituus todella tarkoittaa? Mitä pituutta pidetään harvoin suurena tai pienenä? Onko olemassa ohjeita pituuksien suuruuksien arvioimiseksi? Jos pituus on 90 (tai 30), onko se harvinaista vai täysin merkitsemätöntä?
@whuber Kuten näette, olen kokeillut sitä, mitä ehdotat kysymykseni toisessa versiossa, johon glen_b on vastannut että tästä ei voida johtaa merkitystä. Koska kommenttisi äänestetään jatkuvasti, ehkä sinä tai jotkut äänestäjistä pystytte selittämään, mitä kommenttisi tarkoittaa, missä menin pieleen (toisen versioni kanssa) tai missä glen_b saattaa olla väärässä. Nykyisessä muodossaan kommenttisi ei tarjoa minulle oivalluksia. Harkitse myös kysymykseni nykyistä (toivottavasti lopullista) tarkistusta, jossa olen yrittänyt ilmaista kysymykseni ilman mitään selvästi häiritseviä esimerkkejä.
Tästä kysymyksestä puuttuu ja kommenttini on viitteitä mittayksiköistä. " 90 " sinänsä on merkityksetön. Toinen tärkeä puuttuva elementti on mikä tahansa asiayhteyteen perustuva viitekehys sen määrittämiseksi, onko 90 suuri vai pieni.
Ohjatat minua ympyröissä. Kysymykseni aiempien versioiden esimerkeissä oli mittayksiköitä ja asiayhteyksiä. Näitä kritisoitiin voimakkaasti. Ilmeisesti en pysty löytämään sopivia esimerkkejä ja tekemään johtopäätöksiä yksin. Pyydän nimenomaisesti sinua (tai muita) antamaan esimerkin ja selittämään vastauksen minulle.
Tarkastellessasi alkuperäistä viestiäsi osoitit, että kysyit tätä kysymystä hyvin yleisesti: " Onko olemassa ohjeita varianssin suuruuden arvioimiseksi? " Jos tämä olisi (sanoa) fysiikan sivusto ja joku kysyisi " onko olemassa ohjeita pituuden suuruuden arvioimiseksi, " älä ' luuletko kysymys suljettaisiin heti liian laajaksi (tai liian epämääräiseksi tai molemmiksi)? Toivoin vain, että tämä analogia tekisi selväksi kuinka mahdotonta on vastata kysymykseesi täällä.

Vastaa

Keskustelu uudesta kysymyksestä:

Esimerkiksi, jos haluan tutkia ihmiskehon kokoa ja huomaan, että aikuisen ihmiskehon koko on standardi 2 cm: n poikkeama, luultavasti päätellä, että aikuisen ihmiskehon koko on hyvin yhtenäinen

Se riippuu siitä, mihin vertaamme. Mitä ” vertailutaso, joka tekee siitä hyvin yhdenmukaisen? Jos verrataan sitä pultin pituuden vaihteluun tietyn tyyppisessä pultissa, joka voi olla erittäin vaihteleva.

kun taas 2 cm: n keskihajonta hiiren koko tarkoittaisi sitä, että hiiret eroavat yllättävän paljon ruumiin koosta.

Verrattuna samaan asiaan yhtenäisemmässä ihmisesimerkissäsi; kun on kyse asioiden pituuksista, jotka voivat olla vain positiivisia, on todennäköisesti järkevämpää verrata variaatiokerrointa (kuten huomautan alkuperäisessä vastauksessani), mikä on sama asia kuin SD: n vertaaminen tarkoittamaan, että ehdotat täällä .

Keskihajonnan merkitys on tietysti sen suhde keskiarvoon,

Ei, ei aina. Jos kyseessä on esineiden koko tai esineiden määrä (esim. hiilen määrä, rahamäärä), sillä on usein järkevää, mutta muissa yhteyksissä ei ole järkevää verrata keskiarvoon.

Silloinkin ne eivät välttämättä ole vertailukelpoisia asioista toiseen. Kaikille ei sovelleta standardia kuinka muuttuja jotain on ennen sen muuttujaa.

ja keskihajonta, joka on noin kymmenesosa keskiarvosta, ei ole merkitsevä (esim. älykkyysosamäärä: SD = 0,15 * M).

Mitä asioita verrataan tässä? Pituudet älykkyysosamääriin ? Miksi on järkevää verrata toisiaan? Huomaa, että keskiarvojen 100 ja sd 15 valinta yhden tyyppiselle IQ-testille on täysin mielivaltainen. Heillä ei ole yksiköitä. Se olisi yhtä helposti voinut olla keskiarvo 0 sd 1 tai keskiarvo 0.5 ja sd 0.1.

Mutta mitä pidetään ”pienenä” ja mitä ”suurena”, kun on kyse keskihajonnan ja keskiarvon suhteesta?

Sisältyy jo alkuperäiseen vastaukseeni, mutta kaunopuheisemmin katettu whuberin kommenttiin – ei ole olemassa yhtä standardia, ja siellä ei ”t olla.

Jotkut Cohenia koskevista huomautuksistani koskevat edelleen tätä tapausta (sd suhteessa keskiarvoon on ainakin yksikkövapaa); mutta vaikka sanottaisiin, kuten sanotaan Cohen ”d, sopiva standardi yhdessä kontekstissa ei välttämättä sovi toiseen.

Vastaukset aiempaan versioon

Laskemme ja ilmoitamme aina keskiarvot ja keskihajonnat.

No, ehkä paljon aikaa; En tiedä, että teen aina sitä. Joissakin tapauksissa se ei ole niin merkityksellistä.

Mutta mitä varianssin koko todella tarkoittaa?

Keskihajonta on eräänlainen keskimääräinen * etäisyys keskiarvosta. Varianssi on standardipoikkeama. Keskihajonta mitataan samoissa yksiköissä kuin data; varianssi on neliöyksikköinä.

* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )

He kertovat sinulle jotain tietojen” hajautuksesta ”(tai jakaumasta, jos lasket uudelleen sd: n tai varianssin jakauma).

Oletetaan esimerkiksi, että tarkkailemme, minkä paikan ihmiset ottavat tyhjään huoneeseen. Jos havaitsemme, että suurin osa ihmisistä istuu lähellä ikkunaa vähän vaihtelevasti,

Tämä ei tarkalleen merkitse ”minkä istuimen” tallentamista, mutta ”etäisyyden ikkunasta” tallentaminen. (Tietäen, että ”enemmistö istuu lähellä ikkunaa”, se ei välttämättä kerro sinulle mitään keskiarvosta eikä keskiarvon vaihtelusta. Se kertoo sinulle, että mediaani etäisyyden ikkunasta on oltava pieni.)

voimme olettaa tämän tarkoittavan sitä, että ihmiset yleensä haluavat sijaita ikkunan lähellä ja saada näkymän tai tarpeeksi valoa on tärkein motivoiva tekijä istuimen valinnassa.

Se, että mediaani on pieni, ei sinänsä kerro sitä. Voit päätellä sen muista seikoista, mutta syihin voi olla kaikenlaisia syitä se, jota emme voi millään tavalla erottaa tiedoista.

Jos toisaalta huomaamme, että vaikka suurin osa istuu lähellä ikkunaa Myös muilla usein istuvilla istuimilla on suuri varianssi (esim. monet istuvat lähellä ovea, toiset istuvat lähellä vesiannostelijaa tai sanomalehtiä), voimme olettaa, että vaikka monet ihmiset haluavat istua lähellä ikkunaa, näyttää siltä, että olla enemmän tekijöitä kuin valoa tai näkymää, jotka vaikuttavat istumapaikkojen valintaan ja erilaisiin mieltymyksiin eri ihmisillä.

Jälleen ”tuot tietoja uudelleen tietojen ulkopuolelle; se saattaa olla voimassa tai ei. Kaikille tiedämme, että valo on parempi kaukana ikkunasta, koska päivä on pilvinen tai kaihtimet on vedetty.

Millä arvoilla c ja sanomme, että havaitsemamme käyttäytyminen on hyvin vaihtelevaa (eri ihmiset haluavat istua eri paikoissa)?

Mikä tekee keskihajonnasta suuren tai pienen, ei määritä jokin ulkoinen standardi, vaan aiheenäkökohdat ja jossain määrin, mitä teet tiedot ja jopa henkilökohtaiset tekijät.

Positiivisilla mittauksilla, kuten etäisyyksillä, on kuitenkin joskus tärkeää ottaa huomioon keskihajonta suhteessa keskiarvoon (variaatiokerroin); se on edelleen mielivaltainen, mutta jakaumat, joiden variaatiokerroin on paljon pienempi kuin 1 (keskihajonta paljon pienempi kuin keskiarvo), ovat jossain mielessä ”erilaisia” kuin ne, joissa se on paljon suurempi kuin 1 (keskihajonta paljon suurempi kuin keskiarvo) , joka on usein taipumus olla voimakkaasti oikeassa vinossa).

Ja milloin voimme päätellä, että käyttäytyminen on enimmäkseen tasaista (kaikki haluavat istua ikkunassa)

Varo sanan ”yhtenäinen” käyttöä tässä mielessä, koska merkityksesi on helppo tulkita väärin (esim. jos sanon, että ihmiset ovat ” tasaisesti istuen huoneen ympärillä ”, mikä tarkoittaa melkein päinvastoin kuin mitä tarkoitat). Yleensä tilastoja keskustellessasi vältä yleensä ammattikielten termien käyttöä niiden tavallisessa merkityksessä.

ja tietojemme osoittama pieni vaihtelu johtuu enimmäkseen satunnaisista vaikutuksista tai sekoittavista muuttujista (lika yhdessä tuolissa, aurinko liikkunut ja enemmän varjossa takana jne.)?

Ei, jälleen, tuot uudelleen ulkoista tietoa keskusteltavaan tilastomäärään. Varianssi ei kerro sinulle mitään sellaista.

Onko tietojen varianssin suuruuden arvioimiseksi ohjeita, samanlaisia kuin Cohenin ohjeet vaikutuksen koon tulkinnalle (korrelaatio 0,5 on suuri, 0,3 on kohtalainen ja 0,1 pieni)?

Ei yleensä, ei.

Cohen ”s vaikutuskokojen keskustelu [1] on vivahteikkaampaa ja tilannekohtaisempaa kuin ilmoitat; hän antaa taulukon kahdeksasta eri arvosta pienistä keskisuurista ja suurista riippuen siitä millaista asiaa keskustellaan. Antamasi numerot koskevat eroja riippumattomissa keskiarvoissa (Cohenin s d).
Cohenin efektikoot skaalataan yksikkömääriin . Vakiopoikkeama ja varianssi eivät ole – vaihda yksiköitä ja molemmat muuttuvat.
Cohenin efektikoot on tarkoitettu sovellettaviksi tietylle käyttöalueelle (ja silloinkin pidän Liian keskittyminen niihin standardeihin, jotka ovat pieniä, keskisuuria ja suuria, sekä mielivaltaisia että hieman määrittelevämpiä kuin haluaisin. Ne ovat enemmän tai vähemmän kohtuullisia aiotulle käyttöalueelleen, mutta voivat olla täysin sopimattomia muilla alueilla (Esimerkiksi korkean energian fysiikka vaatii usein tehosteita, jotka kattavat monia vakiovirheitä, mutta Cohensin tehokoot ekvivalentit voivat olla monta suuruusluokkaa enemmän kuin mitä saavutetaan).

Esimerkiksi, jos 90% (tai vain 30%) havainnoista kuuluu yhteen keskihajontaan keskiarvosta, onko se harvinaista tai täysin merkitsemätöntä ?

Ah, huomaa nyt, että olet lopettanut keskustelun keskihajonnan / varianssin koosta ja alkanut keskustella Havaintojen osuus keskimääräisen keskihajonnan sisällä, täysin erilainen käsite. Hyvin karkeasti sanottuna tämä liittyy enemmän jakauman huippuun.

Esimerkiksi muuttamatta varianssia voin muuttaa populaation osuutta 1 sd: n sisällä keskiarvosta melko helposti. Jos populaatiolla on $ t_3 $ -jakauma, noin 94% siitä on 1 sd: n sisällä keskiarvosta, jos jakauma on tasainen, noin 58% on 1 sd: n keskiarvosta; ja beeta ($ \ frac18, \ frac18 $) -jakauman ollessa kyseessä se on noin 29%; tämä voi tapahtua, kun kaikilla on samat standardipoikkeamat tai jos jokin niistä on suurempi tai pienempi muuttamatta näitä prosenttiosuuksia – se ei todellakaan liity leviämiseen, koska määritit aikavälin keskihajonnan perusteella.

[1]: Cohen J. (1992),
”A power primer”
Psychol Bull. , 112 (1), heinäkuu: 155-9.

Kommentit

Jos jakauma on identtinen, prosenttiosuus vahvistetaan eikä muutu.
Jos asiat toimivat kuten pitäisi, et voi ' et voi poistaa sitä; kun " omistat " kysymyksesi, kun kysymyksellä on vastauksia, et ' Niitä ei saa poistaa, joten kysymyksen – kelvollisen kysymyksen ja kelvollisten vastausten – tulisi pysyä , vaikka se ' ei olisikaan mitä halusit kysyä . Ehdotan, että ' ehdotan, että aloitat uuden kysymyksesi joillakin peruskäsitteillä; saatat löytää monia nykyisiä intuitiosi, joita <

ei sovelleta.

Se ' on selkeämpi kysymys ja on ollut hyvä kysyä. Valitettavasti ongelmana on, että ' muutit kysymystä dramaattisesti tavalla, joka mitätöi saamasi vastaukset (toinen melko kokonaan, minun osittain). Miksi sitä ei pitäisi vain palata takaisin sellaisena kuin se oli, kun se sai vastaukset?

Sen sijaan, että poistat aikaisemman, voit lisätä tarkistamasi kysymyksen loppuun ja jättää alkuperäisen niin, että toinen vastaus näyttää silti vastaavan kysymykseen. ' on tuskin oikeudenmukaista asettaa Tim ' alun perin kelvollista vastausta vaaraan saada merkintä " ei vastausta " (ja poistettiin sitten), kun hänen vastauksensa vastasi tärkeään osaan alun perin kysyttyäsi. Helppo tapa on kopioida se, mikä sinulla on nyt (esimerkiksi muistilehtiöikkunaan), kääntää kysymyksesi taaksepäin ja muokata, jotta voit liittää sen uuteen sisältöön (ja lisätä kaikki selitykset tarpeelliseksi katsomastasi muutoksesta).

(a), vertailua hiiriin ei tullut myöhemmin keskustelussa. Tuolloin, kun kutsuit sitä " hyvin yhtenäiseksi ", hiiristä ei ollut mainittu. (b) Ei, ' ei ole suhdetta keskiarvon ja sd: n välillä normaalijakaumissa yleensä; normaali on sijaintimittakaavan perhe. On olemassa esimerkiksi eksponentiaalijakaumia. …(ctd)

Vastaa

Lähettäjä Chebyshev ” eriarvoisuus tiedämme, että todennäköisyys, että $ x $ on $ k $ kertaa $ \ sigma $ keskiarvosta, on korkeintaan $ \ frac {1} {k ^ 2} $:

$$ \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$

Joitakin jakeluoletuksia tehdessäsi voit kuitenkin olla tarkempi, esim. Normaali likiarvo johtaa 68–95–99,7 -sääntöön . Yleensä käyttämällä mitä tahansa kumulatiivista jakelutoimintoa voit valitse jokin aikaväli, jonka tulisi kattaa tietty prosenttiosuus tapauksista. Luottamusvälin leveyden valitseminen on kuitenkin subjektiivinen päätös, kuten tässä säikeessä käsitellään.

Esimerkki
Mielestäni intuitiivisin esimerkki on älykkyys -mitta. Älyä on asia, jota ei voida mitata suoraan, me ei ole suoria älykkyysyksiköitä (muuten senttimetrejä) tai celsiusasteet ovat myös jotenkin mielivaltaisia). Älykkyyskokeet pisteytetään siten, että niiden keskiarvo on 100 ja keskihajonta 15. Mitä se kertoo meille? Kun tiedämme keskiarvon ja keskihajonnan, voimme helposti päätellä, mitkä pisteet voidaan pitää ”matalina”, ”keskiarvoisina” tai ”korkeina”. ”Keskiarvona” voimme luokitella sellaiset pisteet, jotka ovat saaneet useimmat ihmiset (sanotaan 50%), korkeammat pisteet voidaan luokitella ”keskimääräistä korkeammiksi”, harvoin korkeat pisteet voidaan luokitella ”paremmiksi” jne., Tämä tarkoittaa alla olevaa taulukkoa .

Wechsler (WAIS – III) 1997 IQ-testiluokitus IQ-alue (”deviation IQ”)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low 
(Lähde: https://en.wikipedia.org/wiki/IQ_classification )

Joten keskihajonta kertoo meille, kuinka pitkälle voimme olettaa, että yksittäiset arvot ovat kaukana keskiarvosta. Voit ajatella $ \ sigma $: ta etäisyydellä keskiarvosta. Jos ajattelet havaittavia pisteitä, sanokaa älykkyystestitulokset, kuin standardipoikkeamien tuntemisen avulla voit helposti päätellä, kuinka kaukana (kuinka monta $ \ sigma $ ”s) jokin arvo on keskiarvosta ja kuinka yleinen tai harvinainen se on. subjektiivinen kuinka monta $ \ sigma $: ta luokitellaan ”kaukaiseksi”, mutta tämä voidaan helposti määritellä ajattelemalla todennäköisyyttä havaita arvoja, jotka ovat tietyllä etäisyydellä keskiarvosta. katso varianssi ($ \ sigma ^ 2 $)

$$ \ operaattorin nimi {Var} (X) = \ operaattorin nimi {E} \ vasen [(X – \ mu) ^ 2 \ oikea] . $$

… $ X $ ”: n odotettu (keskimääräinen) etäisyys dollarista $ \ mu $. Jos mietit, voit lukea täältä miksi se on neliö .

Kommentit

Tulkinta keskiarvosta vaatii normaalia. Älykkyysosaa ei normaalisti jaeta (hännät ovat paksumpi ja käyrä on vinossa) .Siksi 3-sigma-sääntöä ei sovelleta. Tulkintasi on myös pyöreä, koska älykkyysosaluokitus perustuu satunnaisesti SD: hen eikä puolestaan voi selittää SD: tä.

Kommentit

Vastaa

Kommentit

Vastaa

Kommentit

Vastaa Peruuta vastaus