Jeg ønsker at simulere fra en normal tæthed (sig gennemsnit = 1, sd = 1) men vil kun have positive værdier.

En måde er at simulere fra en normal og tage den absolutte værdi. Jeg tænker på dette som en foldet normal.

Jeg ser i R der er funktioner til trunkeret tilfældig variabel generation. Hvis jeg simulerer fra en afkortet normal (trunkering ved 0) svarer dette til den foldede tilgang?

Svar

Ja, tilgange giver de samme resultater for en nul-middel Normalfordeling.

Det er tilstrækkeligt at kontrollere, at sandsynligheder er enige om intervaller, fordi disse genererer sigma-algebra for alle (Lebesgue) målbare sæt. Lad $ \ Phi $ være standard Normal tæthed: $ \ Phi ((a, b]) $ giver sandsynligheden for, at en normal normalvariat ligger i intervallet $ (a, b] $. Derefter for $ 0 \ le a \ le b $, den afkortede sandsynlighed er

$$ \ Phi _ {\ text {trunkeret}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$

(fordi $ \ Phi ([0, \ infty]) = 1/2 $) og den foldede sandsynlighed er

$$ \ Phi _ {\ text {foldet}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$

på grund af symmetrien på $ \ Phi $ omkring $ 0 $.

Denne analyse gælder for enhver distribution, der er symmetrisk omkring $ 0 $ og har nul sandsynlighed for at være $ 0 $. Hvis gennemsnittet ikke er nul , er fordelingen dog ikke symmetrisk, og de to tilgange giver ikke det samme resultat, som de samme beregninger viser.

Tre fordelinger

Denne graf viser sandsynlighedsdensitetsfunktionerne for en normal (1,1) fordeling (gul), en foldet Normal (1,1) distribution (rød) og en afkortet normal (1,1) distribution (blå). Bemærk, hvordan den foldede fordeling ikke deler den karakteristiske klokkekurveform med de to andre. Den blå kurve (trunkeret fordeling) er den positive del af den gule kurve, skaleret op til at have enhedsareal, mens den røde kurve (foldet fordeling) er summen af den positive del af den gule kurve og dens negative hale (som afspejlet omkring y-aksen).

Kommentarer

  • Jeg kan godt lide billedet.

Svar

Lad $ X \ sim N (\ mu = 1, SD = 1) $. Fordelingen af $ X | X > 0 $ er bestemt ikke den samme som for $ | X | $.

En hurtig test i R:

x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100) 

Dette giver følgende. simulationshistogrammer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *