Se o PDF normal padrão for $$ f (x) = \ frac {1} {\ sqrt {2 \ pi}} e ^ {- x ^ 2/2} $$
e o CDF é $$ F (x) = \ frac {1} {\ sqrt {2 \ pi}} \ int _ {- \ infty} ^ xe ^ { -x ^ 2/2} \ mathrm {d} x \ ,, $$
como isso se transforma em uma função de erro de $ z $?
Comentários
- johndcook.com/erf_and_normal_cdf.pdf
- Eu vi isso, mas começa com ERF já definido.
- Bem, há ' uma definição de erf e uma definição do CDF normal. As relações, deriváveis por alguns cálculos de rotina, são mostradas como para saber como converter entre eles e como converter entre seus inversos.
- Desculpe, não ' não vejo muitos dos detalhes. Por exemplo, o CDF é de -Inf a x. Então, como o ERF vai de 0 a x?
- Você está familiarizado com a técnica de cálculo de mudança de variável? Caso contrário, aprenda como fazê-lo.
Resposta
Porque isso aparece frequentemente em alguns sistemas (para Por exemplo, o Mathematica insiste em expressar o CDF Normal em termos de $ \ text {Erf} $), é bom ter um tópico como este que documenta o relacionamento.
Pela definição, a Função de Erro é
$$ \ text {Erf} (x) = \ frac {2} { \ sqrt {\ pi}} \ int_0 ^ xe ^ {- t ^ 2} \ mathrm {d} t. $$
Escrever $ t ^ 2 = z ^ 2/2 $ implica $ t = z / \ sqrt {2} $ (porque $ t $ não é negativo), donde $ \ mathrm {d} t = \ mathrm {d} z / \ sqrt {2} $. Os pontos finais $ t = 0 $ e $ t = x $ torna-se $ z = 0 $ e $ z = x \ sqrt {2} $. Para converter a integral resultante em algo que se pareça com uma função de distribuição cumulativa (CDF), ela deve ser expressa em termos de integrais que têm limites inferiores de $ – \ infty $, assim:
$$ \ text {Erf} (x) = \ frac {2} {\ sqrt {2 \ pi}} \ int_0 ^ {x \ sqrt {2}} e ^ {- z ^ 2/2} \ mathrm {d} z = 2 \ left (\ frac {1} {\ sqrt {2 \ pi}} \ int _ {- \ infty} ^ {x \ sqrt {2}} e ^ {- z ^ 2/2} \ m athrm {d} z – \ frac {1} {\ sqrt {2 \ pi}} \ int _ {- \ infty} ^ 0 e ^ {- z ^ 2/2} \ mathrm {d} z \ right). $ $
Essas integrais no tamanho do lado direito são ambos valores do CDF da distribuição normal padrão,
$$ \ Phi (x) = \ frac {1} {\ sqrt {2 \ pi}} \ int _ {- \ infty} ^ xe ^ {- z ^ 2/2} \ mathrm {d} z. $$
Especificamente,
$ $ \ text {Erf} (x) = 2 (\ Phi (x \ sqrt {2}) – \ Phi (0)) = 2 \ left (\ Phi (x \ sqrt {2}) – \ frac {1} {2} \ right) = 2 \ Phi (x \ sqrt {2}) – 1. $$
Isso mostra como expressar a Função de erro em termos do CDF normal. A manipulação algébrica disso dá facilmente o CDF Normal em termos da Função de Erro:
$$ \ Phi (x) = \ frac {1 + \ text {Erf} (x / \ sqrt {2}) } {2}. $$
Esta relação (para números reais, de qualquer maneira) é exibida em gráficos das duas funções. Os gráficos são curvas idênticas. As coordenadas da função de erro à esquerda são convertidas nas coordenadas de $ \ Phi $ à direita multiplicando as coordenadas $ x $ por $ \ sqrt {2} $, adicionando $ 1 $ às coordenadas $ y $ e, em seguida, dividindo as coordenadas $ y $ por $ 2 $, refletindo a relação
$$ \ Phi (x \ sqrt {2}) = \ frac {\ text {Erf} (x) + 1} {2} $$
em que a notação mostra explicitamente essas três operações de multiplicação, adição e divisão.
Comentários
- Eu acho que $$ \ Phi (x, \ mu, \ sigma) = \ frac {1} {2} \ left (1+ \ text {Erf} \ left (\ frac {x- \ mu} {\ sigma \ sqrt {2}} \ right) \ right) $$ é o correto forma de relacioná-los, considerando a média e o desvio padrão.