Chci simulovat z normální hustoty (řekněme průměr = 1, sd = 1), ale chci pouze kladné hodnoty.
Jeden způsob je simulovat z normálu a brát absolutní hodnotu. Přemýšlím o tom jako o složeném normálu.
Vidím, že v R jsou funkce pro generování zkrácené náhodné proměnné. Pokud simuluji ze zkráceného normálu (zkrácení na 0), odpovídá to složenému přístupu?
Odpovědět
Ano, přístupy poskytují stejné výsledky pro nulový průměr normální rozdělení.
Stačí zkontrolovat pravděpodobnosti dohodněte se na intervalech, protože ty generují sigma algebru všech (Lebesgueových) měřitelných množin. Nechť $ \ Phi $ je standardní Normální hustota: $ \ Phi ((a, b]) $ dává pravděpodobnost, že standardní Normální variace leží v intervalu $ (a, b] $. Pak pro $ 0 \ le a \ le b $, zkrácená pravděpodobnost je
$$ \ Phi _ {\ text {zkrácený}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$
(protože $ \ Phi ([0, \ infty]) = 1/2 $) a složená pravděpodobnost je
$$ \ Phi _ {\ text {folded}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$
kvůli symetrii $ \ Phi $ kolem $ 0 $.
Tato analýza platí pro jakoukoli distribuci, která je symetrický kolem $ 0 $ a má nulovou pravděpodobnost, že bude $ 0 $. Pokud je průměr nenulový , distribuce je není symetrický a oba přístupy neposkytují stejný výsledek, jak ukazují stejné výpočty.
Tento graf ukazuje funkce hustoty pravděpodobnosti pro normální (1,1) rozdělení (žluté), přeložené Normální (1,1) rozdělení (červená) a zkrácené normální (1,1) rozdělení (modrá). Všimněte si, jak složená distribuce nesdílí charakteristický tvar zvonové křivky s ostatními dvěma. Modrá křivka (zkrácená distribuce) je kladná část žluté křivky, zvětšená tak, aby měla jednotkovou plochu, zatímco červená křivka (složená distribuce) je součtem kladné části žluté křivky a jejího záporného ocasu (jak se odráží kolem osa y).
Komentáře
- Líbí se mi obrázek.
Odpověď
Nechť $ X \ sim N (\ mu = 1, SD = 1) $. Distribuce $ X | X > 0 $ rozhodně není stejná jako distribuce $ | X | $.
Rychlý test v R:
x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100)
Tím získáte následující informace.