Hva betyr størrelsen på standardavviket? [duplikat]

Dette spørsmålet har allerede svar her :

Kommentarer

Jeg vil foreslå at du får betydelig innsikt i disse spørsmålene ved å erstatte " varians " eller " standardavvik " av en annen (mer kjent) mengde som spiller en analog rolle i kvantitativ beskrivelse, for eksempel lengde. Når de fleste fysiske objektene beskrives, vil forskere rapportere om lengden. Hva betyr lengden egentlig? Hvilken lengde anses som uvanlig stor eller liten? Finnes det retningslinjer for å vurdere lengdenes størrelse? Hvis en lengde er 90 (eller 30), er det uvanlig eller helt lite bemerkelsesverdig?
@whuber Som du kan se, har jeg prøvd det du foreslår i den andre revisjonen av spørsmålet mitt, som glen_b har svart at ingen mening kan hentes fra dette. Siden kommentaren din stadig blir stemt opp, kan du eller noen av de som velger å stemme forklare hva kommentaren din betyr, hvor jeg gikk galt (med min andre revisjon) eller hvor glen_b kan ta feil. Slik det ser ut, gir din kommentar meg ingen innsikt. Vennligst vurder den nåværende (forhåpentligvis endelige) revisjonen av spørsmålet mitt, der jeg har forsøkt å uttrykke spørsmålet mitt uten noen av de åpenbart distraherende eksemplene.
Det som mangler i dette spørsmålet, og kommentaren min er noen indikasjon av måleenhetene. " 90 " i seg selv er meningsløst. Et annet viktig manglende element er enhver kontekstuell referanseramme for å avgjøre om 90 er stor eller liten.
Du leder meg rundt i sirkler. Jeg hadde måleenheter og sammenhenger i eksemplene i tidligere versjoner av spørsmålet mitt. Disse ble sterkt kritisert. Selvfølgelig klarer jeg ikke å finne passende eksempler og komme til en konklusjon på egen hånd. Jeg ber deg eksplisitt (eller noen andre) om å gi et eksempel og forklare svaret for meg.
En gjennomgang av det opprinnelige innlegget ditt viser at du stilte dette spørsmålet med stor allmennhet: " Finnes det retningslinjer for å vurdere størrelsesforskjellen i data? " Hvis dette var (si) fysikkstedet og noen skulle spørre " er det retningslinjer for å vurdere lengdestørrelsen, " ikke ' t du tror spørsmålet ville umiddelbart bli lukket som for bredt (eller for vagt eller begge deler)? Jeg håpet bare at denne analogien skulle gjøre det klart hvor umulig det er å svare på spørsmålet ditt her.

Svar

Diskusjon av det nye spørsmålet:

For eksempel hvis jeg vil studere menneskekroppsstørrelse og jeg finner ut at voksen menneskekroppsstørrelse har en standard avvik på 2 cm, vil jeg sannsynligvis slutte at voksen menneskekroppsstørrelse er veldig ensartet

Det kommer an på hva vi sammenligner med. Hva er standard for sammenligning som gjør det veldig jevnt? Hvis du sammenligner det med variabiliteten i boltlengder for en bestemt type bolt som kan være enormt variabel.

mens et 2 cm standardavvik i størrelse på mus vil bety at mus skiller seg overraskende mye i kroppsstørrelse.

Sammenlignet med det samme i ditt mer ensartede menneskeeksempel, absolutt; når det gjelder lengder på ting, som bare kan være positive, er det sannsynligvis mer fornuftig å sammenligne variasjonskoeffisienten (som jeg påpeker i mitt opprinnelige svar), som er det samme som å sammenligne sd for å bety at du foreslår her .

Tydeligvis er betydningen av standardavviket dens forhold til gjennomsnittet,

Nei, ikke alltid. Når det gjelder størrelser på ting eller mengder ting (f.eks. mengde kull, volum penger), er det ofte fornuftig, men i andre sammenhenger er det ikke fornuftig å sammenligne med gjennomsnittet.

Selv da er de ikke nødvendigvis sammenlignbare fra en ting til en annen. Det er ingen standard for alle ting på hvor variabelt noe er før det er «s variabel.

og et standardavvik rundt en tidel av gjennomsnittet er ikke bemerkelsesverdig (f.eks. for IQ: SD = 0,15 * M).

Hvilke ting sammenligner vi her? Lengder til IQ «s ? Hvorfor er det fornuftig å sammenligne ett sett med ting til et annet? Merk at valget av middel 100 og sd 15 for en type IQ-test er helt vilkårlig. De har ikke enheter. Det kan like gjerne ha vært gjennomsnitt 0 sd 1 eller gjennomsnitt 0.5 og sd 0.1.

Men hva regnes som «lite» og hva som er «stort» når det gjelder forholdet mellom standardavvik og gjennomsnitt?

Allerede dekket i mitt opprinnelige svar, men mer veltalende dekket av whubers kommentar – det er ingen standard, og der kan ikke «t være.

Noen av poengene mine om Cohen gjelder fremdeles for denne saken (sd i forhold til gjennomsnittet er minst enhetsfri); men selv med noe som å si Cohen «s d, er en passende standard i en sammenheng ikke nødvendigvis egnet i en annen.

Svar på en tidligere versjon

Vi beregner og rapporterer alltid middel og standardavvik.

Vel, kanskje mye av tiden; Jeg vet ikke at jeg alltid gjør det. Det er tilfeller der det ikke er så relevant.

Men hva betyr størrelsen på variansen egentlig?

Standardavviket er et slags gjennomsnitt * avstand fra gjennomsnittet. Variansen er kvadratet til standardavvik. Standardavvik måles i de samme enhetene som dataene. Avviket er i kvadratiske enheter.

* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )

De forteller deg noe om hvordan» spredt «dataene er (eller fordelingen, i tilfelle du beregner sd eller varians av en fordeling).

Anta for eksempel at vi observerer hvilket sete folk har i et tomt rom. Hvis vi ser at flertallet av mennesker sitter nær vinduet med liten avvik,

Det er ikke akkurat et tilfelle av å registrere «hvilket sete» men å registrere «avstand fra vinduet». (Å vite «flertallet sitter nær vinduet» forteller deg ikke nødvendigvis noe om gjennomsnittet eller variasjonen om gjennomsnittet. Det det forteller deg er at medianen avstanden fra vinduet må være liten.)

vi kan anta at dette betyr at folk generelt foretrekker å sitte i nærheten av vinduet og få utsikt eller nok lys er den viktigste motivasjonsfaktoren for valg av sete.

At medianen er liten, sier ikke deg selv det. Du kan utlede det av andre hensyn, men det kan være alle mulige grunner til det at vi på ingen måte kan skille oss fra dataene.

Hvis vi derimot observerer at mens den største andelen sitter nær vinduet det er stor avvik med andre seter tatt ofte (f.eks. mange sitter nær døren, andre sitter nær vanndispenseren eller avisene), vi kan anta at mens mange foretrekker å sitte nær vinduet, ser det ut til at være flere faktorer enn lys eller visning som påvirker valg av sitteplasser og forskjellige preferanser hos forskjellige mennesker.

Igjen, du henter inn informasjon utenfor dataene; det kan gjelde eller ikke. For alt vi vet er lyset bedre langt fra vinduet, fordi dagen er overskyet eller persienner er tegnet.

Til hvilke verdier c an vi sier at oppførselen vi har observert er veldig variert (forskjellige mennesker liker å sitte forskjellige steder)?

Hva som gjør et standardavvik stort eller lite, bestemmes ikke av noen ekstern standard, men av hensyn til temaet, og til en viss grad hva du gjør med dataene, og til og med personlige faktorer.

Med positive målinger, for eksempel avstander, er det noen ganger relevant å vurdere standardavvik i forhold til gjennomsnittet (variasjonskoeffisienten); det er fremdeles vilkårlig, men distribusjoner med variasjonskoeffisienter som er mye mindre enn 1 (standardavvik mye mindre enn gjennomsnittet) er «annerledes» i noen forstand enn de der det er mye større enn 1 (standardavvik mye større enn gjennomsnittet , som ofte vil være sterkt skjeve.).

Og når kan vi utlede at oppførselen for det meste er ensartet (alle liker å sitte ved vinduet)

Vær forsiktig med å bruke ordet «uniform» i den forstand, siden det er lett å feiltolke din mening (f.eks. hvis jeg sier at folk er » jevnt sittende rundt rommet «det betyr nesten det motsatte av det du mener). Mer generelt, når du diskuterer statistikk, unngå generelt å bruke sjargonguttrykk i vanlig forstand.

og den lille variasjonen dataene våre viser, er for det meste et resultat av tilfeldige effekter eller forvirrende variabler (smuss på en stol, solen har beveget seg og mer skygge i ryggen osv.)?

Nei, igjen, du henter inn ekstern informasjon til den statistiske størrelsen du diskuterer. Avviket forteller deg ikke noe slikt.

Finnes det retningslinjer for å vurdere størrelsen på varians i data, i likhet med Cohens retningslinjer for å tolke effektstørrelse (en korrelasjon på 0,5 er stor, 0,3 er moderat og 0,1 er liten)?

Ikke generelt, nei.

Cohen «s diskusjon [1] av effektstørrelser er mer nyansert og situasjonell enn du antyder; han gir en tabell med 8 forskjellige verdier av små og store, avhengig av hva slags ting som blir diskutert. Tallene du oppgir, gjelder forskjeller i uavhengige virkemidler (Cohens d).
Cohens effektstørrelser er alle skalert til å være enhetsløse mengder . Standardavvik og varians er ikke – endre enhetene og begge vil endre seg.
Cohens effektstørrelser er ment å gjelde i et bestemt applikasjonsområde (og selv da ser jeg på for mye fokus på de standardene for det som er lite, middels og stort som både noe vilkårlig og noe mer reseptivt enn jeg ønsker). De er mer eller mindre rimelige for sitt tiltenkte bruksområde, men kan være helt uegnet i andre områder. (høyenergifysikk krever for eksempel ofte effekter som dekker mange standardfeil, men ekvivalenter av Cohens effektstørrelser kan være mange størrelsesordener mer enn det man kan oppnå).

For eksempel, hvis 90% (eller bare 30%) av observasjonene faller innenfor ett standardavvik fra gjennomsnittet, er det uvanlig eller helt lite bemerkelsesverdig ?

Ah, merk deg nå at du har sluttet å diskutere størrelsen på standardavvik / varians, og har begynt å diskutere andelen observasjoner innenfor ett standardavvik fra gjennomsnittet, et helt annet konsept. Svært grovt sett er dette mer relatert til fordelingenes topp.

For eksempel, uten å endre variansen i det hele tatt, kan jeg endre andelen av en populasjon innen 1 sd av gjennomsnittet ganske lett. Hvis populasjonen har en $ t_3 $ fordeling, ligger omtrent 94% av den innenfor 1 sd av gjennomsnittet, hvis den har en jevn fordeling, ligger omtrent 58% innenfor 1 sd av gjennomsnittet; og med en beta ($ \ frac18, \ frac18 $) distribusjon, er det omtrent 29%. Dette kan skje med at alle har samme standardavvik, eller med noen av dem som er større eller mindre uten å endre disse prosentene – det er egentlig ikke relatert til spredning i det hele tatt, fordi du definerte intervallet i form av standardavvik.

[1]: Cohen J. (1992),
«A power primer,»
Psychol Bull. , 112 (1), jul: 155-9.

Kommentarer

Hvis fordelingen er identisk, vil prosentandelen være fast, ikke endre.
Hvis ting fungerer som de skal, du vil ikke ' ikke være i stand til å slette den; mens du " eier " spørsmålet ditt, når et spørsmål har svar, trenger du ikke ' ikke får slettet dem, så spørsmålet – et gyldig spørsmål med gyldige svar – bør forbli, selv om det ' ikke er det du ønsket å spørre om . Jeg ' foreslår at du starter det nye spørsmålet ditt med noen grunnleggende konsepter; du kan finne at mange av dine nåværende intuisjoner ikke gjelder '.
Det ' er et klarere spørsmål, og vil har vært en god å spørre. Dessverre er problemet at du ' har endret spørsmålet dramatisk på en måte som ugyldiggjør svarene du mottok (den andre ganske fullstendig, min delvis). Hvorfor skal det ikke bare rulles tilbake til slik det sto da det fikk svarene?
I stedet for å fjerne det du hadde før, kan du legge til det reviderte spørsmålet ditt til slutt, og la originalen ligge i sammenheng, slik at det andre svaret fremdeles ser ut som det svarer på et spørsmål. Det ' er knapt rettferdig å sette Tim ' s opprinnelig gyldige svar i fare for å bli markert som " ikke et svar " (og deretter slettet) da svaret hans svarte på en viktig del av det du opprinnelig spurte. Den enkle måten er å kopiere det du har nå (til å si et notisblokkvindu), rulle spørsmålet ditt tilbake, og redigere for å lime inn det nye innholdet (og legge til en forklaring på endringen du mener er nødvendig).
(a), nei sammenligningen med mus kom senere i diskusjonen. På det tidspunktet du kalte det " veldig ensartet " hadde det ikke blitt nevnt mus. (b) Nei, det er ' ingen sammenheng mellom gjennomsnitt og sd for normalfordelinger generelt; det normale er en sted-skala familie. Det er for eksempel eksponensielle distribusjoner. …(ctd)

Svar

Av Chebyshev «s ulikhet vi vet at sannsynligheten for at noen $ x $ er $ k $ ganger $ \ sigma $ fra gjennomsnitt er maksimalt $ \ frac {1} {k ^ 2} $:

$$ \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$

Men med noen distribusjonsforutsetninger kan du være mer presis, f.eks. Normal tilnærming fører til 68–95–99.7 regel . Vanligvis bruker du en hvilken som helst kumulativ distribusjonsfunksjon velg et intervall som skal omfatte en viss prosentandel av tilfeller. Men å velge konfidensintervallbredde er en subjektiv beslutning som diskutert i denne tråden .

Eksempel
Det mest intuitive eksemplet som kommer til meg er intelligens skala. Intelligens er noe som ikke kan måles direkte, vi ikke har direkte «enheter» av intelligens (forresten, centimeter eller Celsius grader er også på en eller annen måte vilkårlig). Intelligens tester blir scoret slik at de har et gjennomsnitt på 100 og standardavvik på 15. Hva forteller det oss? Å vite gjennomsnitt og standardavvik kan vi enkelt utlede hvilke poeng som kan betraktes som «lave», «gjennomsnittlige» eller «høye». Som «gjennomsnitt» kan vi klassifisere slike score som oppnås av folk flest (si 50%), høyere score kan klassifiseres som «over gjennomsnittet», uvanlig høye score kan klassifiseres som «overlegne» osv., Dette oversetter til tabellen nedenfor .

Wechsler (WAIS – III) 1997 IQ test klassifisering IQ Range («deviation IQ»)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low 
(Kilde: https://en.wikipedia.org/wiki/IQ_classification )

Så standardavvik forteller oss hvor langt vi kan anta at individuelle verdier er fjernt fra gjennomsnittet. Du kan tenke på $ \ sigma $ som enhetsløs avstand fra gjennomsnitt. Hvis du tenker på observerbare poeng, si intelligensprøver, enn å vite standardavvik, kan du enkelt utlede hvor langt (hvor mange $ \ sigma $ «s) noen verdi legger fra gjennomsnittet og så hvor vanlig eller uvanlig det er. Det er subjektivt hvor mange $ \ sigma $ som kvalifiserer som «langt borte», men dette kan lett kvalifiseres ved å tenke i form av sannsynligheten for å observere verdier som ligger i en viss avstand fra gjennomsnittet.

Dette er åpenbart hvis du se på hvilken varians ($ \ sigma ^ 2 $) er

$$ \ operatorname {Var} (X) = \ operatorname {E} \ left [(X – \ mu) ^ 2 \ right] . $$

… den forventede (gjennomsnittlige) avstanden på $ X $ «s fra $ \ mu $. Hvis du lurer på, enn her kan du lese hvorfor er det kvadrat .

Kommentarer

Din tolkning av gjennomsnittet krever normalitet. IQ er ikke normalt fordelt (halene er tykkere og kurven er skjev). Derfor gjelder ikke 3-sigma-regelen. Tolkningen din er også sirkulær, fordi IQ-klassifiseringen er tilfeldig basert på SD og ikke i sin tur kan forklare SD.

Kommentarer

Svar

Kommentarer

Svar

Kommentarer

Legg igjen en kommentar Avbryt svar