For en normalfordeling «klokkeformet» kurve, skulle man tro at høyden skulle ha en ideell verdi. Å vite denne verdien kan være en rask indikator for å sjekke om dataene normalt distribueres.

Jeg kunne imidlertid ikke finne den formelle verdien. De fleste steder vises formen, men ikke målingene på y-aksen. http://www.stat.yale.edu/Courses/1997-98/101/normal.htm

I noen grafer der det er nevnt, er det 0,4. http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg . Men på hovedsiden ( http://en.wikipedia.org/wiki/Normal_distribution ) blir ikke verdien 0,4 nevnt noe sted.

Er dette den riktige verdien, og hva er dens matematiske grunnlag? Takk for innsikten.

Rediger:

De tre kurvene som vises i @Glen_bs svar og på wiki-siden (med gjennomsnitt = 0) har samme gjennomsnitt, men forskjellige SD-er. Alle tester viser at ingen signifikant forskjell mellom dem. Men de kommer tydeligvis fra forskjellige populasjoner. Hvilken test kan vi deretter bruke for å bestemme forskjellen i standardavvik for to fordelinger?

Jeg sjekket på nettet og fant ut at det var F-testen .

Men er det et spesifikt navn for en fordelingskurve som ligner på en med gjennomsnittet 0 og standardavvik på 1 (og topp på 0,4)?

Besvart av Aleksandr Blekh i kommentarer: «standard normalfordeling eller enhetens normalfordeling betegnet med N (0,1)».

Det understrekes imidlertid ikke at, hvis midlene ikke er forskjellige, F-test eller KS test (som foreslått av Glen_b i kommentarene) bør gjøres for å avgjøre om standardavvikene er forskjellige, noe som indikerer forskjellige populasjoner.

Kommentarer

  • Det ' s ikke klart hvilken funksjon " klokkeformet " tjener i spørsmålet ditt. En normal tetthet har en bjelleform (men man kan ha en tydelig bjelleformet tetthet som ' ikke er normal). Hvis du fjernet det, så spørsmålet sa " normalfordeling ", ville det endre intensjonen med spørsmålet?
  • Jeg mente høyden på tetthetskurven til normalt distribuerte data.
  • Ditt krav " alle tester viser ingen signifikant forskjell mellom dem " er usant. Ved rimelige prøvestørrelser, ville en F-test for varians (å teste om avviksforholdet er forskjellig fra 1) lett finne forskjellen, som en enkel Kolmogorov Smirnov-test.
  • Jeg tenkte på alle testene for å sammenligne betyr, som det vanligvis gjøres. Takk for forklaringene.
  • Re: ditt siste spørsmål. Definisjon fra tilsvarende Wikipedia-artikkel : " Hvis $ \ mu = 0 $ og $ \ sigma = 1 $, er distribusjon kalles standard normalfordeling eller enhet normalfordeling angitt med $ N (0,1) $ " min; standard normalfordeling er den som topper på ~ 0.4).

Svar

Høyden på modusen i normal tetthet er $ \ frac {1} {\ sqrt {2 \ pi} \ sigma} \ approx \ frac {.3989} {\ sigma} $ (eller omtrent 0,4 / $ \ sigma $). Du kan se dette ved å erstatte modusen (som også er gjennomsnittet, $ \ mu $) for $ x $ i formelen for en normal tetthet.

Så det er ingen eneste «ideelle høyde» – – det avhenger av standardavviket

edit: se her:
3 normale tettheter

Faktisk kan det samme være sett fra wikipedia-diagrammet du koblet til – det viser fire forskjellige normale tettheter, og bare en av dem har en høyde nær 0,4

En normalfordeling med gjennomsnitt 0 og standardavvik 1 kalles «standard normalfordeling»

Kommentarer

  • Så peakedness indikerer ikke normalitet eller på annen måte? Beklager et veldig grunnleggende spørsmål.
  • Det kommer an på hvordan du ' definerer ' peaked '. Hvis du mener " topphøyde, uten hensyn til relativ spredning " så nei, som du kan se fra diagrammet i spørsmålet ditt, eller det i svaret mitt. Hvis du justerer for spredningen (dvs. standardiserer), så har alle normale tettheter som er standardisert til å ha $ \ sigma = 1 $ samme høyde i modusen, men et uendelig antall unimodale (men ikke-normale) distribusjoner kan ha nøyaktig det samme høyde i modusen (det ' er trivielt å konstruere en, for eksempel via endelige blandingsfordelinger).
  • Se redigeringen i spørsmålet mitt ovenfor.
  • @ Glen_b Hvor fikk du formelhøydeformelen fra? Jeg ' har problemer med å finne en avledning.
  • Ikke noe, jeg skjønte det.Du setter bare $ x = \ mu $ og finner verdien av PDF-filen. Hvis du virkelig vil, kan du også bekrefte at $ x = \ mu $ er maksimalt via differensiering, men i dette tilfellet virker det som for mye.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *