For en normalfordeling “klokkeformet” kurve, ville man have troet, at højden skulle have en ideel værdi. At kende denne værdi kan være en hurtig indikator for at kontrollere, om dataene normalt distribueres.

Jeg kunne dog ikke finde dens formelle værdi. De fleste steder vises formen, men ikke målingerne på y-aksen. http://www.stat.yale.edu/Courses/1997-98/101/normal.htm

I nogle grafer, hvor det er nævnt, er det 0,4. http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg . Men på hovedsiden ( http://en.wikipedia.org/wiki/Normal_distribution ) nævnes værdien på 0,4 ikke nogen steder.

Er dette den korrekte værdi, og hvad er dens matematiske grundlag? Tak for din indsigt.

Rediger:

De tre kurver vist i @Glen_bs svar og på wiki-siden (med middelværdi = 0) har samme gennemsnit men forskellige SDer. Alle tests viser, at ingen signifikant forskel mellem dem. Men de kommer tydeligt fra forskellige populationer. Hvilken test kan vi derefter anvende for at bestemme forskellen i standardafvigelser for to distributioner?

Jeg tjekkede på nettet og fandt ud af at det var F-testen .

Men er der et specifikt navn for en distributionskurve, der svarer til en med gennemsnit på 0 og standardafvigelse på 1 (og peak ved 0,4)?

Besvaret af Aleksandr Blekh i bemærkninger: “standardnormalfordeling eller enhedens normalfordeling betegnet med N (0,1)”.

Det understreges dog ikke, at hvis ikke midlerne er forskellige, F-test eller KS test (som foreslået af Glen_b i kommentarerne) skal udføres for at afgøre, om standardafvigelserne er forskellige, hvilket indikerer forskellige populationer.

Kommentarer

  • Det ' er ikke klart, hvilken funktion " klokkeformet " tjener i dit spørgsmål. En normal tæthed har en klokkeform (men man kan have en tydeligt klokkeformet tæthed, som ' ikke er normal). Hvis du fjernede det, så spørgsmålet lige sagde " normalfordeling ", ville det ændre spørgsmålets hensigt?
  • Jeg mente højden af densitetskurven for normalt distribuerede data.
  • Din påstand " alle tests viser ingen signifikant forskel mellem dem " er falsk. Ved rimelige stikprøvestørrelser ville en F-test for varians (test om forholdet mellem afvigelser adskiller sig fra 1) finde forskellen let, ligesom en simpel Kolmogorov Smirnov-test.
  • Jeg tænkte på alle tests til sammenligning betyder, som det generelt gøres. Tak for dine forklaringer.
  • Re: dit sidste spørgsmål. Definition fra tilsvarende Wikipedia-artikel : " Hvis $ \ mu = 0 $ og $ \ sigma = 1 $, er distribution kaldes standardnormalfordeling eller enhedsnormalfordeling angivet med $ N (0,1) $ " mine; den normale normalfordeling er den, der topper ved ~ 0.4).

Svar

Højden af tilstanden i en normal tæthed er $ \ frac {1} {\ sqrt {2 \ pi} \ sigma} \ approx \ frac {.3989} {\ sigma} $ (eller omtrent 0,4 / $ \ sigma $). Du kan se dette ved at erstatte tilstanden (som også er gennemsnittet, $ \ mu $) for $ x $ i formlen for en normal tæthed.

Så der er ingen enkelt “ideel højde” – – det afhænger af standardafvigelsen

rediger: se her:
3 normale densiteter

Faktisk kan den samme ting være set fra wikipedia-diagrammet, du linkede til – det viser fire forskellige normale tætheder, og kun en af dem har en højde nær 0,4

En normalfordeling med gennemsnit 0 og standardafvigelse 1 kaldes en “normal normalfordeling”

Kommentarer

  • Så peakedness indikerer ikke normalitet eller på anden måde? Beklager et meget grundlæggende spørgsmål.
  • Det afhænger af, hvordan du ' definerer ' peaked '. Hvis du mener " peak-højde uden hensyntagen til relativ spredning " så nej, som du kan se fra diagrammet i dit spørgsmål eller det i mit svar. Hvis du justerer for spredningen (dvs. standardiserer), så har alle normale densiteter, der er standardiseret til at have $ \ sigma = 1 $, den samme højde i tilstanden, men et uendeligt antal unimodale (men ikke-normale) fordelinger kan have nøjagtigt den samme højde i tilstanden (det ' er trivielt at konstruere en, f.eks. via endelige blandingsfordelinger).
  • Se redigeringen i mit spørgsmål ovenfor.
  • @ Glen_b Hvor fik du formel til højde fra tilstand? Jeg ' har problemer med at finde en afledning.
  • Det er ligegyldigt, jeg regnede det ud.Du indstiller bare $ x = \ mu $ og finder værdien af PDF-filen. Hvis du virkelig vil, kan du også bekræfte, at $ x = \ mu $ er et maksimum via differentiering, men i dette tilfælde ser det ud til at være for stort.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *