Desidero simulare da una densità normale (ad esempio media = 1, sd = 1) ma voglio solo valori positivi.
Uno il modo è simulare da una normale e prendere il valore assoluto. Lo considero una normale piegata.
Vedo che in R ci sono funzioni per la generazione di variabili casuali troncate. Se simulo da una normale troncata (troncamento a 0) è equivalente allapproccio piegato?
Risposta
Sì, il approcci danno gli stessi risultati per una media zero distribuzione normale.
È sufficiente verificare che le probabilità concordare sugli intervalli, perché questi generano lalgebra sigma di tutti gli insiemi misurabili (Lebesgue). Sia $ \ Phi $ la densità normale standard: $ \ Phi ((a, b]) $ fornisce la probabilità che una variazione normale standard si trovi nellintervallo $ (a, b] $. Quindi, per $ 0 \ le a \ le b $, la probabilità troncata è
$$ \ Phi _ {\ text {truncated}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$
(perché $ \ Phi ([0, \ infty]) = 1/2 $) e la probabilità piegata è
$$ \ Phi _ {\ text {folded}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$
a causa della simmetria di $ \ Phi $ circa $ 0 $.
Questa analisi vale per qualsiasi distribuzione che sia simmetrica circa $ 0 $ e ha zero probabilità di essere $ 0 $. Se la media è diversa da zero , tuttavia, la distribuzione è non simmetrico e i due approcci non danno lo stesso risultato, come mostrano gli stessi calcoli.
Questo grafico mostra le funzioni di densità di probabilità per una distribuzione Normale (1,1) (gialla), piegata Distribuzione normale (1,1) (rosso) e distribuzione normale (1,1) troncata (blu). Si noti come la distribuzione piegata non condivida la caratteristica forma a campana con le altre due. La curva blu (distribuzione troncata) è la parte positiva della curva gialla, ridimensionata per avere area unitaria, mentre la curva rossa (distribuzione piegata) è la somma della parte positiva della curva gialla e della sua coda negativa (riflessa intorno lasse y).
Commenti
- Mi piace limmagine.
Risposta
Sia $ X \ sim N (\ mu = 1, SD = 1) $. La distribuzione di $ X | X > 0 $ è decisamente diversa da quella di $ | X | $.
Un rapido test in R:
x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100)
Questo dà quanto segue.