For en normalfordeling «klokkeformet» kurve, skulle man tro at høyden skulle ha en ideell verdi. Å vite denne verdien kan være en rask indikator for å sjekke om dataene normalt distribueres.
Jeg kunne imidlertid ikke finne den formelle verdien. De fleste steder vises formen, men ikke målingene på y-aksen. http://www.stat.yale.edu/Courses/1997-98/101/normal.htm
I noen grafer der det er nevnt, er det 0,4. http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg . Men på hovedsiden ( http://en.wikipedia.org/wiki/Normal_distribution ) blir ikke verdien 0,4 nevnt noe sted.
Er dette den riktige verdien, og hva er dens matematiske grunnlag? Takk for innsikten.
Rediger:
De tre kurvene som vises i @Glen_bs svar og på wiki-siden (med gjennomsnitt = 0) har samme gjennomsnitt, men forskjellige SD-er. Alle tester viser at ingen signifikant forskjell mellom dem. Men de kommer tydeligvis fra forskjellige populasjoner. Hvilken test kan vi deretter bruke for å bestemme forskjellen i standardavvik for to fordelinger?
Jeg sjekket på nettet og fant ut at det var F-testen .
Men er det et spesifikt navn for en fordelingskurve som ligner på en med gjennomsnittet 0 og standardavvik på 1 (og topp på 0,4)?
Besvart av Aleksandr Blekh i kommentarer: «standard normalfordeling eller enhetens normalfordeling betegnet med N (0,1)».
Det understrekes imidlertid ikke at, hvis midlene ikke er forskjellige, F-test eller KS test (som foreslått av Glen_b i kommentarene) bør gjøres for å avgjøre om standardavvikene er forskjellige, noe som indikerer forskjellige populasjoner.
Kommentarer
- Det ' s ikke klart hvilken funksjon " klokkeformet " tjener i spørsmålet ditt. En normal tetthet har en bjelleform (men man kan ha en tydelig bjelleformet tetthet som ' ikke er normal). Hvis du fjernet det, så spørsmålet sa " normalfordeling ", ville det endre intensjonen med spørsmålet?
- Jeg mente høyden på tetthetskurven til normalt distribuerte data.
- Ditt krav " alle tester viser ingen signifikant forskjell mellom dem " er usant. Ved rimelige prøvestørrelser, ville en F-test for varians (å teste om avviksforholdet er forskjellig fra 1) lett finne forskjellen, som en enkel Kolmogorov Smirnov-test.
- Jeg tenkte på alle testene for å sammenligne betyr, som det vanligvis gjøres. Takk for forklaringene.
- Re: ditt siste spørsmål. Definisjon fra tilsvarende Wikipedia-artikkel : " Hvis $ \ mu = 0 $ og $ \ sigma = 1 $, er distribusjon kalles standard normalfordeling eller enhet normalfordeling angitt med $ N (0,1) $ " min; standard normalfordeling er den som topper på ~ 0.4).
Svar
Høyden på modusen i normal tetthet er $ \ frac {1} {\ sqrt {2 \ pi} \ sigma} \ approx \ frac {.3989} {\ sigma} $ (eller omtrent 0,4 / $ \ sigma $). Du kan se dette ved å erstatte modusen (som også er gjennomsnittet, $ \ mu $) for $ x $ i formelen for en normal tetthet.
Så det er ingen eneste «ideelle høyde» – – det avhenger av standardavviket
edit: se her:
Faktisk kan det samme være sett fra wikipedia-diagrammet du koblet til – det viser fire forskjellige normale tettheter, og bare en av dem har en høyde nær 0,4
En normalfordeling med gjennomsnitt 0 og standardavvik 1 kalles «standard normalfordeling»
Kommentarer
- Så peakedness indikerer ikke normalitet eller på annen måte? Beklager et veldig grunnleggende spørsmål.
- Det kommer an på hvordan du ' definerer ' peaked '. Hvis du mener " topphøyde, uten hensyn til relativ spredning " så nei, som du kan se fra diagrammet i spørsmålet ditt, eller det i svaret mitt. Hvis du justerer for spredningen (dvs. standardiserer), så har alle normale tettheter som er standardisert til å ha $ \ sigma = 1 $ samme høyde i modusen, men et uendelig antall unimodale (men ikke-normale) distribusjoner kan ha nøyaktig det samme høyde i modusen (det ' er trivielt å konstruere en, for eksempel via endelige blandingsfordelinger).
- Se redigeringen i spørsmålet mitt ovenfor.
- @ Glen_b Hvor fikk du formelhøydeformelen fra? Jeg ' har problemer med å finne en avledning.
- Ikke noe, jeg skjønte det.Du setter bare $ x = \ mu $ og finner verdien av PDF-filen. Hvis du virkelig vil, kan du også bekrefte at $ x = \ mu $ er maksimalt via differensiering, men i dette tilfellet virker det som for mye.