Opmerkingen
- Ik zou willen suggereren dat aanzienlijk inzicht in deze vragen kan worden verkregen door te vervangen " variantie " of " standaarddeviatie " door een andere (meer bekende) grootheid die een analoge rol speelt in de kwantitatieve beschrijving, zoals lengte. Bij het beschrijven van de meeste fysieke objecten, zullen wetenschappers een lengte rapporteren. Wat betekent de lengte eigenlijk? Welke lengte wordt als ongewoon groot of klein beschouwd? Zijn er richtlijnen voor het beoordelen van de grootte van lengtes? Als een lengte 90 (of 30) is, is dat dan ongebruikelijk of volkomen onopvallend?
- @whuber Zoals je kunt zien, heb ik geprobeerd wat je suggereert in de tweede herziening van mijn vraag, waarop glen_b heeft geantwoord dat hieraan geen betekenis kan worden ontleend. Aangezien uw opmerking voortdurend wordt gestemd, kunnen u of sommige van de up-stemmers misschien uitleggen wat uw opmerking betekent, waar ik fout ging (met mijn tweede herziening) of waar glen_b zich zou kunnen vergissen. Zoals het er nu uitziet, geeft uw opmerking mij geen inzicht. Overweeg ook de huidige (hopelijk definitieve) herziening van mijn vraag, waarin ik heb geprobeerd mijn vraag te formuleren zonder de duidelijk afleidende voorbeelden.
- Wat ontbreekt in deze vraag en mijn opmerking is een indicatie van de maateenheden. " 90 " op zichzelf is zinloos. Een ander cruciaal ontbrekend element is elk contextueel referentiekader om te bepalen of 90 groot of klein is.
- Je leidt me rond in cirkels. Ik had maateenheden en contexten in de voorbeelden in eerdere versies van mijn vraag. Deze werden zwaar bekritiseerd. Het is duidelijk dat ik geen geschikte voorbeelden kan vinden en zelf tot een conclusie kan komen. Ik vraag jou (of iemand anders) expliciet om te geven een voorbeeld en het antwoord aan mij uit te leggen.
- Uit een recensie van je oorspronkelijke bericht blijkt dat je deze vraag in het algemeen stelde: " Zijn er richtlijnen voor het beoordelen van de omvang van de variantie in gegevens? " Als dit (bijvoorbeeld) de Physics-site was en iemand het zou vragen " zijn er richtlijnen voor het beoordelen van de grootte van de lengte, " niet ' denk je de vraag zou onmiddellijk worden afgesloten als te breed (of te vaag of beide)? Ik hoopte alleen dat deze analogie duidelijk zou maken hoe onmogelijk het is om je vraag hier te beantwoorden.
Antwoord
Discussie over de nieuwe vraag:
Als ik bijvoorbeeld de lichaamsgrootte van een mens wil bestuderen en ik vind dat de grootte van een volwassen mens een standaard heeft afwijking van 2 cm, zou ik waarschijnlijk afleiden dat de lichaamsgrootte van een volwassen mens zeer uniform is.
Het hangt af van waar we mee vergelijken. standaard van vergelijking die dat erg uniform maakt? Als je het vergelijkt met de variabiliteit in boutlengtes voor een bepaald type bout, kan dat enorm variabel zijn.
terwijl een standaarddeviatie van 2 cm in de grootte van muizen zou betekenen dat muizen verrassend veel verschillen in lichaamsgrootte.
Zeker in vergelijking met hetzelfde in uw meer uniforme mensenvoorbeeld; als het gaat om lengtes van dingen, die alleen positief kunnen zijn, is het waarschijnlijk logischer om de variatiecoëfficiënt te vergelijken (zoals ik in mijn oorspronkelijke antwoord al aangaf), wat hetzelfde is als het vergelijken van sd om te bedoelen dat je hier suggereert .
De betekenis van de standaarddeviatie is duidelijk de relatie met het gemiddelde,
Nee, niet altijd. In het geval van grootte van dingen of hoeveelheden van dingen (bijv. tonnage steenkool, hoeveelheid geld), is dat vaak logisch, maar in andere contexten heeft het geen zin om te vergelijken met het gemiddelde.
Zelfs dan zijn ze niet noodzakelijkerwijs vergelijkbaar van het ene ding naar het andere. Er is geen standaard van toepassing op alle dingen hoe variabel iets is voordat het variabel is.
en een standaarddeviatie rond een tiende van het gemiddelde is onopvallend (bijv. voor IQ: SD = 0.15 * M).
Welke dingen vergelijken we hier? Lengtes tot IQsWaarom is het logisch om de ene reeks dingen met de andere te vergelijken? Merk op dat de keuze van gemiddelde 100 en sd 15 voor één soort IQ-test volkomen willekeurig is. Ze hebben geen eenheden. Het had net zo goed gemiddelde 0 sd 1 of gemiddelde 0 kunnen zijn.5 en sd 0.1.
Maar wat wordt als “klein” en wat als “groot” beschouwd als het gaat om de relatie tussen standaarddeviatie en gemiddelde?
Al behandeld in mijn oorspronkelijke antwoord, maar welsprekender behandeld in de opmerking van Whuber – er is geen standaard, en kan “t zijn.
Sommige van mijn opmerkingen over Cohen zijn daar nog steeds van toepassing op dit geval (sd relatief ten opzichte van mean is op zijn minst unit-vrij); maar zelfs met zoiets als Cohens d, is een geschikte standaard in de ene context niet per se geschikt in een andere.
Antwoorden op een eerdere versie
We berekenen en rapporteren altijd gemiddelden en standaarddeviaties.
Nou, misschien een groot deel van de tijd; Ik weet niet dat ik het altijd doe. Er zijn gevallen waarin het niet zo relevant is.
Maar wat betekent de grootte van de variantie eigenlijk?
De standaarddeviatie is een soort gemiddelde * afstand van het gemiddelde. De variantie is het kwadraat van de standaarddeviatie. Standaarddeviatie wordt gemeten in dezelfde eenheden als de gegevens; variantie is in kwadratische eenheden.
* (RMS – https://en.wikipedia.org/wiki/Root_mean_square )
Ze vertellen u iets over hoe” verspreid “de gegevens zijn (of de verdeling, in het geval dat u” de sd of variantie van een distributie).
Neem bijvoorbeeld aan dat we observeren welke stoel mensen innemen in een lege kamer. Als we zien dat de meerderheid van de mensen met weinig variatie dicht bij het raam zit,
Dat is niet bepaald een geval van opnemen “welke stoel”, maar “afstand van het raam” opnemen. (Wetende dat “de meerderheid dicht bij het raam zit” zegt niet per se iets over het gemiddelde of de variatie over het gemiddelde. Wat het je vertelt is dat de mediaan afstand tot het raam moet klein zijn.)
we kunnen aannemen dat dit betekent dat mensen over het algemeen liever bij het raam zitten en zicht of voldoende licht krijgen is de belangrijkste motiverende factor bij het kiezen van een stoel.
Dat de mediaan klein is, zegt op zichzelf niet dat. Je zou het uit andere overwegingen kunnen afleiden, maar er kunnen allerlei redenen zijn voor dat we “op geen enkele manier kunnen onderscheiden van de gegevens.
Als we daarentegen waarnemen dat terwijl het grootste deel dicht bij het raam zit er is een grote variatie met andere stoelen die vaak ook worden ingenomen (bijv. velen zitten dicht bij de deur, anderen zitten dicht bij de waterdispenser of de kranten), we kunnen aannemen dat hoewel veel mensen liever dicht bij het raam zitten, er meer factoren zijn dan licht of uitzicht die van invloed zijn op de zitplaatskeuze en verschillende voorkeuren bij verschillende mensen.
Nogmaals, je brengt informatie binnen buiten de gegevens; het kan van toepassing zijn of misschien niet. Voor zover we weten is het licht beter ver van het raam, omdat het bewolkt is of de jaloezieën zijn dichtgetrokken.
Bij welke waarden c en zeggen we dat het gedrag dat we hebben waargenomen erg gevarieerd is (verschillende mensen zitten graag op verschillende plaatsen)?
Wat een standaarddeviatie groot of klein maakt, wordt niet bepaald door een of andere externe standaard, maar door overwegingen van het onderwerp, en tot op zekere hoogte wat je ermee doet de gegevens en zelfs persoonlijke factoren.
Bij positieve metingen, zoals afstanden, is het echter soms relevant om rekening te houden met de standaarddeviatie ten opzichte van het gemiddelde (de variatiecoëfficiënt); het is nog steeds willekeurig, maar verdelingen met variatiecoëfficiënten veel kleiner dan 1 (standaarddeviatie veel kleiner dan het gemiddelde) zijn in zekere zin anders dan die waarbij het veel groter is dan 1 (standaarddeviatie veel groter dan het gemiddelde , die vaak de neiging heeft om erg scheef te zijn).
En wanneer kunnen we concluderen dat het gedrag meestal uniform is (iedereen zit graag voor het raam)
Pas op voor het gebruik van het woord “uniform” in die zin, aangezien het gemakkelijk is om uw betekenis verkeerd te interpreteren (bijvoorbeeld als ik zeg dat mensen ” gelijkmatig in de kamer zitten “dat betekent bijna het tegenovergestelde van wat u bedoelt). Meer in het algemeen, bij het bespreken van statistieken, vermijd over het algemeen het gebruik van jargontermen in hun gewone betekenis.
en de kleine variatie die onze gegevens laten zien, is meestal het resultaat van willekeurige effecten of verstorende variabelen (vuil op een stoel, de zon is bewogen en meer schaduw achterin, enz.)?
Nee, nogmaals, je brengt externe informatie in de statistische hoeveelheid die je bespreekt. De variantie zegt je zoiets niet.
Zijn er richtlijnen voor het beoordelen van de grootte van variantie in gegevens, vergelijkbaar met de richtlijnen van Cohen voor het interpreteren van effectgrootte (een correlatie van 0,5 is groot, 0,3 is matig en 0.1 is klein)?
Niet in het algemeen, nee.
-
Cohen “s de bespreking [1] van effectgroottes is genuanceerder en situatiever dan u aangeeft; hij geeft een tabel met 8 verschillende waarden van klein, middelgroot en groot, afhankelijk van wat er wordt besproken. De getallen die u geeft, zijn van toepassing op verschillen in onafhankelijke middelen (Cohens d).
-
Cohens effectgroottes zijn allemaal geschaald om eenhedenloze hoeveelheden te zijn . Standaarddeviatie en variantie zijn dat niet – verander de eenheden en beide zullen veranderen.
-
De effectgroottes van Cohen zijn bedoeld om toe te passen in een bepaald toepassingsgebied (en zelfs dan beschouw ik te veel aandacht voor die standaarden van wat klein, middelgroot en groot is, omdat ze beide enigszins willekeurig en enigszins voorschrijvend zijn dan ik zou willen). Ze zijn min of meer redelijk voor het beoogde toepassingsgebied, maar kunnen op andere gebieden volkomen ongeschikt zijn (hoge-energiefysica vereist bijvoorbeeld vaak effecten die veel standaardfouten dekken, maar equivalenten van Cohens effectgroottes kunnen vele ordes van grootte groter zijn dan wat haalbaar is).
Als bijvoorbeeld 90% (of slechts 30%) van de waarnemingen binnen één standaarddeviatie van het gemiddelde valt, is dat ongebruikelijk of volledig onopvallend ?
Ah, merk nu op dat je bent gestopt met het bespreken van de grootte van standaarddeviatie / variantie, en bent begonnen met het bespreken van de Het aandeel waarnemingen binnen één standaarddeviatie van het gemiddelde, een heel ander concept. Heel grofweg is dit meer gerelateerd aan de piek van de verdeling.
Bijvoorbeeld, zonder de variantie überhaupt te veranderen, kan ik het aandeel van een populatie binnen 1 sd van het gemiddelde vrij gemakkelijk veranderen. Als de populatie een $ t_3 $ -verdeling heeft, ligt ongeveer 94% ervan binnen 1 sd van het gemiddelde, als het een uniforme verdeling heeft, ligt ongeveer 58% binnen 1 sd van het gemiddelde; en met een bèta-distributie ($ \ frac18, \ frac18 $) is dat ongeveer 29%; dit kan gebeuren als ze allemaal dezelfde standaarddeviaties hebben, of als ze allemaal groter of kleiner zijn zonder die percentages te veranderen – het is helemaal niet echt gerelateerd aan spread, omdat je het interval hebt gedefinieerd in termen van standaarddeviatie.
[1]: Cohen J. (1992),
“A power primer,”
Psychol Bull. , 112 (1), juli: 155-9.
Reacties
- Als de distributie identiek is, zou het percentage vast zijn en niet veranderen.
- Als alles werkt zoals het hoort, je hebt ' niet meer kunnen verwijderen; terwijl u " eigenaar bent van " uw vraag, als een vraag eenmaal antwoorden heeft, hoeft u ' ze kunnen niet worden verwijderd, dus de vraag – een geldige vraag met geldige antwoorden – zou moeten blijven, zelfs als deze ' niet is wat je wilde vragen . Ik ' stel voor dat u uw nieuwe vraag begint met enkele basisconcepten; je zult merken dat veel van je huidige intuïties niet ' van toepassing zijn.
- Het ' is een duidelijkere vraag, en zou is een goede vraag geweest. Helaas is het probleem dat u ' de vraag drastisch hebt veranderd op een manier die de ontvangen antwoorden ongeldig maakt (de andere redelijk volledig, de mijne gedeeltelijk). Waarom zou je het niet gewoon terugdraaien zoals het was toen het die antwoorden kreeg?
- In plaats van te verwijderen wat je eerder had, kun je je herziene vraag aan het einde toevoegen en het origineel laten voor context, zodat het andere antwoord er nog steeds uitziet alsof het een vraag beantwoordt. Het ' is nauwelijks eerlijk om het oorspronkelijk geldige antwoord van Tim ' te plaatsen dat het gevaar loopt te worden gemarkeerd als " geen antwoord " (en vervolgens verwijderd) toen zijn antwoord reageerde op een belangrijk deel van wat je oorspronkelijk vroeg. De gemakkelijke manier is om wat je nu hebt te kopiëren (in bijvoorbeeld een notitieblokvenster), je vraag terug te draaien en vervolgens te bewerken om opnieuw te plakken in de nieuwe inhoud (en een eventuele uitleg toe te voegen over de verandering die volgens jou nodig is).
- (a), nee, de vergelijking met muizen kwam later in de discussie. Op het moment dat je het " zeer uniform " noemde, was er geen melding gemaakt van muizen. (b) Nee, er ' s geen relatie tussen gemiddelde en sd voor normale distributies in het algemeen; het normale is een gezin op locatieschaal. Er zijn bijvoorbeeld exponentiële distributies.(ctd)
Antwoord
Door Chebyshev “s ongelijkheid we weten dat de kans dat ongeveer $ x $ $ k $ maal $ \ sigma $ van gemiddeld is, hoogstens $ \ frac {1} {k ^ 2} $:
$$ is \ Pr (| X- \ mu | \ geq k \ sigma) \ leq \ frac {1} {k ^ 2} $$
Maar door enkele aannames over de distributie te doen, kunt u nauwkeuriger zijn, bijv. Normaal benadering leidt tot 68–95–99.7 regel . In het algemeen kunt u met een cumulatieve verdelingsfunctie kies een interval dat een bepaald percentage gevallen moet omvatten. Het kiezen van de breedte van het betrouwbaarheidsinterval is echter een subjectieve beslissing, zoals besproken in deze thread .
Voorbeeld
Het meest intuïtieve voorbeeld dat bij me opkomt is de schaal van intelligentie . Intelligentie is iets dat niet direct kan worden gemeten. hebben geen directe “eenheden” van intelligentie (trouwens, centimeters of graden Celsius zijn ook op de een of andere manier willekeurig). Intelligentie tests worden zo gescoord dat ze een gemiddelde van 100 en een standaarddeviatie van 15 hebben. Wat zegt het ons? Als we gemiddelde en standaarddeviatie kennen, kunnen we gemakkelijk afleiden welke scores als “laag”, “gemiddeld” of “hoog” kunnen worden beschouwd. Als gemiddeld kunnen we dergelijke scores classificeren die door de meeste mensen worden behaald (zeg maar 50%), hogere scores kunnen worden geclassificeerd als bovengemiddeld, ongewoon hoge scores kunnen worden geclassificeerd als superieur enz., Dit vertaalt zich naar de onderstaande tabel .
Wechsler (WAIS – III) 1997 IQ-testclassificatie IQ-bereik (“deviation IQ”)
IQ Classification 130 and above Very superior 120–129 Superior 110–119 High average 90–109 Average 80–89 Low average 70–79 Borderline 69 and below Extremely low
Dus standaarddeviatie vertelt ons hoe ver we kunnen aannemen dat individuele waarden ver verwijderd zijn van het gemiddelde. U kunt $ \ sigma $ zien als een eenheidloze afstand tot het gemiddelde. Als je aan waarneembare scores denkt, zeg maar intelligentietestscores, dan stelt het kennen van standaarddeviaties je in staat gemakkelijk af te leiden hoe ver (hoeveel $ \ sigma $ “s) een waarde van het gemiddelde ligt en dus hoe vaak of ongewoon het is. subjectief hoeveel $ \ sigma $ “s kwalificeren als” ver weg “, maar dit kan gemakkelijk worden gekwalificeerd door te denken in termen van waarschijnlijkheid dat waarden worden waargenomen die op een bepaalde afstand van het gemiddelde liggen.
Dit is duidelijk als u kijk welke variantie ($ \ sigma ^ 2 $) is
$$ \ operatornaam {Var} (X) = \ operatornaam {E} \ left [(X – \ mu) ^ 2 \ right] . $$
… de verwachte (gemiddelde) afstand van $ X $ “s vanaf $ \ mu $. Als je je afvraagt, dan kun je hier waarom is het in het kwadraat .
Opmerkingen
- Uw interpretatie van het gemiddelde vereist normaliteit. IQ is niet normaal verdeeld (de staarten zijn dikker en de curve is scheef). Daarom is de 3-sigma-regel niet van toepassing. Ook is uw interpretatie circulair, omdat de IQ-classificatie willekeurig is gebaseerd op de SD en op zijn beurt de SD niet kan verklaren.