Jeg ønsker å simulere fra normal tetthet (si middel = 1, sd = 1) men vil bare ha positive verdier.

En måten er å simulere fra en normal og ta den absolutte verdien. Jeg tenker på dette som en brettet normal.

Jeg ser i R at det er funksjoner for avkortet generering av tilfeldig variabel. Hvis jeg simulerer fra en avkortet normal (avkorting ved 0), tilsvarer dette den brettede tilnærmingen?

Svar

Ja, tilnærminger gir de samme resultatene for en null-middel Normalfordeling.

Det er tilstrekkelig å sjekke at sannsynligheter bli enige om intervaller, fordi disse genererer sigmaalgebra for alle (Lebesgue) målbare sett. La $ \ Phi $ være standard Normal tetthet: $ \ Phi ((a, b]) $ gir sannsynligheten for at en standard normalvariat ligger i intervallet $ (a, b] $. For $ 0 \ le a \ le b $, er den avkortede sannsynligheten

$$ \ Phi _ {\ text {avkortet}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$

(fordi $ \ Phi ([0, \ infty]) = 1/2 $) og den brettede sannsynligheten er

$$ \ Phi _ {\ text {foldet}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$

på grunn av symmetrien til $ \ Phi $ ca $ 0 $.

Denne analysen holder for enhver distribusjon som er symmetrisk rundt $ 0 $ og har null sannsynlighet for å være $ 0 $. Hvis gjennomsnittet ikke er null , er fordelingen imidlertid ikke symmetrisk og de to tilnærmingene gir ikke det samme resultatet, som de samme beregningene viser.

Tre fordelinger

Denne grafen viser sannsynlighetstetthetsfunksjonene for en normal (1,1) fordeling (gul), en brettet Normal (1,1) fordeling (rød), og en avkortet normal (1,1) fordeling (blå). Legg merke til hvordan den brettede fordelingen ikke deler den karakteristiske bjellekurveformen med de to andre. Den blå kurven (avkortet fordeling) er den positive delen av den gule kurven, skalert opp til å ha enhetsareal, mens den røde kurven (brettet fordeling) er summen av den positive delen av den gule kurven og dens negative hale (som reflektert rundt y-aksen).

Kommentarer

  • Jeg liker bildet.

Svar

La $ X \ sim N (\ mu = 1, SD = 1) $. Fordelingen av $ X | X > 0 $ er definitivt ikke den samme som for $ | X | $.

En rask test i R:

x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100) 

Dette gir følgende. simuleringshistogrammer

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *