Erre a kérdésre már itt vannak válaszok :

Megjegyzések

  • Azt szeretném javasolni, hogy ezekbe a kérdésekbe jelentős betekintést nyerhessünk a " variancia " vagy " szórás " valamilyen más (ismertebb) mennyiséggel, amely analóg szerepet játszik a kvantitatív leírásban, például a hossza. A legtöbb fizikai tárgy leírásakor a tudósok jelenteni fognak egy hosszúságot. Mit jelent valójában a hossz? Milyen hosszúságúnak számít ritkán nagy vagy kicsi? Vannak-e irányelvek a hosszúság nagyságának felmérésére? Ha a hossza 90 (vagy 30), akkor ez szokatlan vagy teljesen figyelemre méltó?
  • @whuber Mint látható, kipróbáltam, amit a kérdésem második felülvizsgálatában javasol, amire a glen_b válaszolt hogy ebből semmi jelentés nem vezethető le. Mivel a megjegyzésedet folyamatosan felértékelik, talán te vagy a szavazók egy része meg tudja magyarázni, mit jelent a megjegyzés, hol tévedtem (a második átdolgozásommal), vagy hol tévedhet a glen_b. Jelenlegi véleménye nem nyújt betekintést számomra. Kérem, vegye figyelembe kérdésem jelenlegi (remélhetőleg végleges) felülvizsgálatát, ahol megkíséreltem kérdésemet kifejezni a nyilvánvalóan zavaró példák nélkül.
  • Ami hiányzik ebből a kérdésből, és a megjegyzésem bármilyen jelzés a mértékegységek. " 90 " önmagában értelmetlen. Egy másik kulcsfontosságú hiányzó elem a kontextus szerinti referenciakeret annak megállapítására, hogy a 90 nagy vagy kicsi.
  • Körben vezetsz engem. A kérdésem korábbi verzióinak példáiban mértékegységek és összefüggések voltak. Ezeket erősen bírálták. Nyilvánvalóan képtelen vagyok megfelelő példákat találni, és egyedül levonni a következtetést. Kifejezetten arra kérlek benneteket (vagy bárkit mást), hogy adjon példát és magyarázza el nekem a választ.
  • Eredeti bejegyzésének áttekintése azt mutatja, hogy ezt a kérdést nagy általánosságban tette fel: " Vannak-e iránymutatások az adatok variancia nagyságának felmérésére? " vannak útmutatások a hossz nagyságának felmérésére, " ne gondolja, hogy a kérdés azonnal lezárulna, mivel túl széles (vagy túl homályos, vagy mindkettő)? Csak abban reménykedtem, hogy ez a hasonlat megmutatja, mennyire lehetetlen itt megválaszolni a kérdését.

Válasz

Az új kérdés megvitatása:

Például, ha az emberi test méretét szeretném tanulmányozni, és azt tapasztalom, hogy a felnőtt emberi test méretének szabványa van 2 cm eltérés, valószínűleg arra következtetnék, hogy a felnőtt emberi test nagysága nagyon egységes.

Attól függ, mihez hasonlítunk. összehasonlítási színvonal, amely ezt nagyon egységessé teszi? Ha összehasonlítja egy adott típusú csavar hosszának változékonyságával, amely rendkívül változó lehet.

míg a 2 cm-es szórás a az egerek nagysága azt jelentené, hogy az egerek meglepően különböznek testméretükben.

Összehasonlítva az egyenletesebb emberi példádban szereplő példával, természetesen; ha a dolgok hosszáról van szó, ami csak pozitív lehet, akkor valószínűleg ésszerűbb összehasonlítani a variációs együtthatót (amint arra az eredeti válaszomban rámutattam), ami ugyanaz, mint az sd összehasonlításával azt jelenteni, hogy ön itt javasol .

Nyilvánvaló, hogy a szórás jelentése az átlaghoz való viszonya,

Nem, nem mindig. A dolgok nagysága vagy a mennyiségek (pl. szénmennyiség, pénzmennyiség) esetén ennek gyakran van értelme, más összefüggésekben nincs értelme összehasonlítani az átlaggal.

Akkor sem feltétlenül hasonlíthatók össze egyik dologból a másikba. Nincs mindenre vonatkozó szabvány mennyi változó van valami előtt a változó.

és az átlag tizede körüli szórás nem figyelemre méltó (pl. IQ esetén: SD = 0,15 * M).

Mely dolgokat hasonlítunk itt össze? Hosszak az IQ-hez ? Miért van értelme összehasonlítani a dolgok egyikét a másikkal? Ne feledje, hogy az átlag 100 és sd 15 kiválasztása egyfajta IQ teszt esetében teljesen önkényes. Nincs egységük. Könnyen lehet, hogy átlag 0 sd 1 vagy 0.5. és sd 0.1.

De mi tekinthető “kicsi” -nek és mi “nagy”, ha a szórás és az átlag viszonyára van szükség?

Már az eredeti válaszomban szerepel, de beszédesebb módon a whuber kommentjeiben szerepel – nincs egy szabvány, és ott nem “t be.

Néhány, a Cohennel kapcsolatos állításom továbbra is érvényes erre az esetre (az sd az átlaghoz viszonyítva legalább egységmentes); de még olyasmi mellett is, mint mondjuk Cohen “s d, az egyik kontextusban a megfelelő szabvány nem feltétlenül alkalmas a másikban.


Válaszok egy korábbi verzióra

Mindig kiszámoljuk és jelentjük az átlagokat és a szórásokat.

Nos, talán sokszor; Nem tudom, hogy mindig csinálom. Vannak olyan esetek, amikor ez nem annyira releváns.

De mit jelent valójában a variancia mérete?

A szórás egyfajta átlag * távolság az átlagtól. A szórás a négyzet négyzet standard deviáció. A szórást az adatokkal megegyező egységekben mérjük; a szórás négyzetes egységekben van.

* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )

Valamit elárulnak arról, hogy az adatok hogyan” oszlanak el “(vagy az eloszlásról, abban az esetben, ha újból kiszámolod az eloszlás).

Tegyük fel például, hogy megfigyeljük, hogy az emberek melyik helyet foglalják el egy üres szobában. Ha azt vesszük észre, hogy az emberek többsége csekély eltéréssel ül az ablak közelében,

Ez nem éppen „melyik ülés” rögzítésének esete, hanem az “ablaktól való távolság” rögzítése. (Tudva, hogy “a többség az ablak közelében ül,” nem feltétlenül mond semmit sem az átlagról, sem az átlag variációjáról. Amit mond, az az, hogy a medián az ablak távolságának kicsinek kell lennie.)

feltételezhetjük, hogy ez azt jelenti, hogy az emberek általában inkább az ablak közelében helyezkednek el, és nézetet vagy elég fényt kapnak a fő motiváló tényező az ülés kiválasztásában.

Az, hogy a medián kicsi, önmagában ezt nem mondja meg neked. Lehet, hogy más megfontolásokból következtethetsz rá, de ennek mindenféle oka lehet. azt, hogy “semmilyen módon nem tudjuk megkülönböztetni az adatokat.

Ha viszont azt tapasztaljuk, hogy míg a legnagyobb arány az ablak közelében ül, nagy eltérés mutatkozik a gyakran elfoglalt egyéb ülésekkel (pl. sokan az ajtó közelében ülnek, mások a vízadagoló vagy az újságok közelében ülnek), feltételezhetjük, hogy bár sokan inkább az ablak közelében ülnek, úgy tűnik, több tényező legyen, mint a fény vagy a nézet, amelyek befolyásolják az ülőhelyválasztást és a különböző emberek eltérő preferenciáit.

Ismét az adatokon kívüli információkat hoz be; Lehet, hogy érvényes, vagy nem. Mindannyian tudjuk, hogy a fény jobb van az ablaknál, mert borult a nap, vagy a rolót behúzzák.

Milyen értékeken c és azt mondjuk, hogy az általunk megfigyelt viselkedés nagyon változatos (különböző emberek szeretnek különböző helyeken ülni)?

Amitől a szórás nagy vagy kicsi, azt nem valamilyen külső standard határozza meg, hanem a tárgy szempontjai, és bizonyos mértékben az is, hogy mit csinálsz az adatok, sőt a személyes tényezők is.

Pozitív mérések, például távolságok mellett azonban időnként releváns az átlaghoz (a variációs együtthatóhoz) viszonyított szórás figyelembevétele; ez még mindig önkényes, de az 1-nél jóval kisebb variációs együtthatóval rendelkező szórások (a szórás az átlagnál jóval kisebb) bizonyos értelemben “különböznek”, mint azok, ahol sokkal nagyobbak, mint 1 (a szórás sokkal nagyobb, mint az átlag , amely gyakran erősen jobbra torzul).

És mikor következtethetünk arra, hogy a viselkedés többnyire egységes (mindenki szeret az ablaknál ülni)

Vigyázzon az “egyenruha” szó ilyen értelemben történő használatával, mivel “félreértelmezheti a jelentését (pl. ha azt mondom, hogy az emberek” egyenletesen ül a szoba körül “, ami majdnem az ellenkezőjét jelenti annak, amire gondolsz.” A statisztikák megvitatásakor általában kerüljük a zsargon kifejezések közönséges használatát.

és az adataink által mutatott kis eltérés többnyire véletlenszerű hatások vagy zavaró változók következménye (piszok az egyik székben, a nap mozgása és több árnyék a hátuljában stb.)?

Nem, ezúttal is külső információkat hoz be a tárgyalt statisztikai mennyiségbe. A variancia nem mond neked ilyet.

Vannak-e iránymutatások az adatok szórásának nagyságának értékeléséhez, hasonlóan Cohen útmutatásaihoz a hatásméret értelmezéséhez (0,5 korreláció nagy, 0,3 közepes, és 0,1 kicsi)?

Általában nem, nem.

  1. Cohen “s az effektméretek tárgyalása [1] árnyaltabb és helyzetesebb, mint ahogyan Ön jelzi; 8 különböző kis és közepes értéket tartalmazó táblázatot ad, attól függően, hogy milyen dologról van szó. Az Ön által megadott számok a független eszközök különbségeire vonatkoznak (Cohen s d).

  2. A Cohen effektusok méretét egységtelen mennyiségekre méretezik . A szórás és a szórás nem – változtassa meg az egységeket, és mindkettő változni fog.

  3. A Cohen-effektusméretek egy adott alkalmazási területen alkalmazhatók (és akkor is túl sok hangsúlyt fektetnek azokra a szabványokra, amelyek kicsiek, közepesek és nagyak, mind kissé önkényesek, mind valamivel előíróbbak, mint szeretném. (a nagy energiájú fizikához például gyakran olyan effektusokra van szükség, amelyek sok szokásos hibát fednek le, de a Cohens effektusméretek ekvivalensei sok nagyságrenddel többek lehetnek, mint amit el lehet érni).

Például, ha a megfigyelések 90% -a (vagy csak 30% -a) egy átlag eltérésbe esik az átlagtól, az nem gyakori vagy teljesen figyelemre méltó ?

Ó, vegye figyelembe, hogy abbahagyta a szórás / szórás nagyságának tárgyalását, és elkezdte tárgyalni a A megfigyelések aránya az átlag egy szórásán belül, teljesen más fogalom. Nagyon durván véve ez inkább az eloszlás csúcspontjával függ össze.

Például anélkül, hogy a varianciát egyáltalán megváltoztatnám, elég könnyen meg tudom változtatni a populáció arányát az átlag 1 sd-jén belül. Ha a populáció $ t_3 $ eloszlású, annak kb. 94% -a az átlag 1 sd-jén belül van, ha egyenletes eloszlása van, akkor körülbelül 58% -a az átlag 1 sd-jén belül van; és béta ($ \ frac18, \ frac18 $) eloszlás esetén ez körülbelül 29%; ez akkor fordulhat elő, ha mindegyiküknek ugyanazok a szórásai vannak, vagy bármelyikük nagyobb vagy kisebb anélkül, hogy megváltoztatná ezeket a százalékokat – valójában egyáltalán nem kapcsolódik a terjedéshez, mert az intervallumot a szórás alapján határozta meg.

[1]: Cohen J. (1992),
“A power primer”
Psychol Bull. , 112 (1), július: 155–9.

Megjegyzések

  • Ha az eloszlás azonos, akkor a százalék rögzül, nem változik.
  • Ha a dolgok úgy működnek, ahogy kellene, nem fogod tudni ' törölni; míg " a " kérdésed van, a kérdés megválaszolása után nem ' Nem kell törölni őket, ezért a kérdésnek – érvényes kérdésre érvényes válaszokkal – meg kell maradnia, még akkor is, ha ' nem az, amiről szeretnél kérdezni . ' javaslom, hogy kezdje új kérdését néhány alapfogalommal; sok jelenlegi megérzését megtalálhatja, hogy ne alkalmazza '.
  • Ez ' egyértelműbb kérdés, és jó volt megkérdezni. Sajnos az a probléma, hogy ' drámai módon megváltoztatta a kérdést oly módon, hogy érvényteleníti a kapott válaszokat (a másik meglehetősen teljesen, részben az enyém). Miért ne lehetne egyszerűen visszagurítani a jelenlegi állapotába, amikor megkapta ezeket a válaszokat?
  • Azonban ahelyett, hogy eltávolítaná az előzőeket, hozzáadhatja a felülvizsgált kérdését a végén, és az eredetit megteheti összefüggésben, így a másik válasz még mindig úgy néz ki, mintha egy kérdésre válaszolna. ' aligha igazságos, ha Tim ' eredetileg érvényes választ " nem válasz " (majd törölve), amikor válasza az Ön által eredetileg kért fontos részre adott választ. A legegyszerűbb módja annak, hogy átmásolja azt, ami most van (mondjuk egy jegyzettömb ablakba), tekerje vissza a kérdését, majd szerkessze az új tartalom újraragasztásához (és adjon meg minden szükséges magyarázatot a szükséges változtatásra).
  • (a), az egerekkel való összehasonlítás nem történt később a vita során. Abban az időben, amikor " nagyon egységes " nevet kapta, az egerekről nem tettek említést. (b) Nem, ' nincs összefüggés az átlag és az sd között általában a normál eloszlásokhoz; a normális egy hely-léptékű család. Mondjuk vannak exponenciális eloszlások. …(ctd)

Válasz

Írta: Chebyshev ” egyenlőtlenség tudjuk, hogy annak valószínűsége, hogy egyes $ x $ $ k $ szorzat $ \ sigma $ lesz az átlagtól, legfeljebb $ \ frac {1} {k ^ 2} $:

$$ \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$

Néhány disztribúciós feltevés megfogalmazásával azonban pontosabb lehet, pl. Normal a közelítés 68–95–99,7 szabályhoz vezet . Általában bármely kumulatív elosztási függvényt használva megteheti válasszon olyan intervallumot, amely az esetek egy bizonyos százalékát felöleli. Azonban a konfidencia intervallum szélességének megválasztása szubjektív döntés, amint ezt a ebben a szálban tárgyaltuk.

Példa
A leg intuitívabb példa az intelligencia skála jut eszembe. Az intelligencia olyan dolog, amelyet közvetlenül nem lehet mérni, mi ne rendelkezzenek intelligencia közvetlen “egységekkel” (egyébként centiméterekkel vagy a Celsius fok is valahogy önkényes). Az intelligencia teszteket úgy pontozzák, hogy azok átlaga 100 és szórása 15 legyen. Mit mond ez nekünk? Az átlag és a szórás ismeretében könnyen megállapíthatjuk, hogy melyik pontszám tekinthető “alacsonynak”, “átlagosnak” vagy “magasnak”. “Átlagként” osztályozhatjuk a legtöbb ember által elért pontszámokat (mondjuk 50%), a magasabb pontszámokat az “átlag feletti”, a ritkán magas pontszámokat “felsőbbnek” stb., Ez az alábbi táblázatra utal .

Wechsler (WAIS – III) 1997 IQ teszt besorolás IQ tartomány (“deviáció IQ”)

IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low 

(Forrás: https://en.wikipedia.org/wiki/IQ_classification )

Tehát a szórás megmondja, hogy mennyire feltételezhetjük, hogy az egyes értékek távol vannak az átlagtól. Gondolhat $ $ sigma $ -ra, mint az átlagtól való egység nélküli távolságra. Ha megfigyelhető pontszámokra gondol, mondjuk intelligencia teszt-pontszámokra, akkor a szórások ismerete lehetővé teszi, hogy könnyen megállapítsa, hogy egy-egy érték mennyit (hány $ \ sigma $ “-ot tartalmaz az átlagtól, és hogy mennyire általános vagy ritka. szubjektív hány $ \ sigma $ minősül “távoli” -nak, de ez könnyen minősíthető azáltal, hogy gondolkodunk annak valószínűségében, hogy megfigyeljük az átlagtól bizonyos távolságban fekvő értékeket.

Ez nyilvánvaló, ha nézd meg, hogy mi a variancia ($ \ sigma ^ 2 $)

$$ \ operátornév {Var} (X) = \ operátornév {E} \ left [(X – \ mu) ^ 2 \ right] . $$

… a (z) $ X $ “s várható (átlagos) távolsága $ \ mu $ -tól. Ha kíváncsi rá, itt olvashatja a következőt: miért négyzetes .

Megjegyzések

  • Az átlag értelmezéséhez normális működésre van szükség. Az IQ általában nem oszlik el (a farok vastagabb és a görbe ferde). Ezért a 3-sigma-szabály nem alkalmazható. Értelmezése körkörös is, mivel az IQ osztályozás véletlenszerűen az SD-n alapul, és ez nem magyarázhatja az SD-t.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük