Desejo simular a partir de uma densidade normal (digamos média = 1, sd = 1), mas só quero valores positivos.
Um forma é simular de um normal e tirar o valor absoluto. Eu penso nisso como um normal dobrado.
Vejo em R que há funções para geração de variável aleatória truncada. Se eu simular a partir de um normal truncado (truncamento em 0), isso é equivalente à abordagem dobrada?
Resposta
Sim, o abordagens fornecem os mesmos resultados para uma distribuição normal média zero .
É suficiente verificar as probabilidades concordar em intervalos, porque estes geram a álgebra sigma de todos os conjuntos mensuráveis (de Lebesgue). Seja $ \ Phi $ a densidade normal padrão: $ \ Phi ((a, b]) $ dá a probabilidade de que uma variável normal padrão se encontre no intervalo $ (a, b] $. Então, para $ 0 \ le a \ le b $, a probabilidade truncada é
$$ \ Phi _ {\ text {truncado}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$
(porque $ \ Phi ([0, \ infty]) = 1/2 $) e a probabilidade de dobramento é
$$ \ Phi _ {\ text {dobrado}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$
devido à simetria de $ \ Phi $ sobre $ 0 $.
Esta análise é válida para qualquer distribuição que seja simétrico em torno de $ 0 $ e tem probabilidade zero de ser $ 0 $. Se a média for diferente de zero , no entanto, a distribuição é não simétrico e as duas abordagens não fornecem o mesmo resultado, como mostram os mesmos cálculos.
Este gráfico mostra as funções de densidade de probabilidade para uma distribuição Normal (1,1) (amarelo), um dobrado Distribuição normal (1,1) (vermelho) e uma distribuição normal truncada (1,1) (azul). Observe como a distribuição dobrada não compartilha a forma característica da curva em sino com as outras duas. A curva azul (distribuição truncada) é a parte positiva da curva amarela, aumentada para ter área unitária, enquanto a curva vermelha (distribuição dobrada) é a soma da parte positiva da curva amarela e sua cauda negativa (conforme refletido ao redor eixo y).
Comentários
- Gosto da imagem.
Resposta
Seja $ X \ sim N (\ mu = 1, SD = 1) $. A distribuição de $ X | X > 0 $ definitivamente não é a mesma de $ | X | $.
Um teste rápido em R:
x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100)
Isso dá o seguinte.