Ich möchte aus einer normalen Dichte simulieren (sagen wir Mittelwert = 1, sd = 1), möchte aber nur positive Werte.

Eins Weg ist, von einer Normalen zu simulieren und den absoluten Wert zu nehmen. Ich betrachte dies als eine gefaltete Normalität.

Ich sehe in R Funktionen für die Erzeugung abgeschnittener Zufallsvariablen. Wenn ich von einer abgeschnittenen Normalen simuliere (Abschneiden bei 0), entspricht dies dem gefalteten Ansatz?

Antwort

Ja, die Ansätze liefern die gleichen Ergebnisse für eine Null-Mittelwert Normalverteilung.

Es reicht aus, diese Wahrscheinlichkeiten zu überprüfen vereinbaren Intervalle, da diese die Sigma-Algebra aller (Lebesgue) messbaren Mengen erzeugen. Sei $ \ Phi $ die Standardnormaldichte: $ \ Phi ((a, b]) $ gibt die Wahrscheinlichkeit an, dass eine Standardnormalvariable im Intervall $ (a, b] $ liegt. Dann gilt für $ 0 \ le a \ le b $ ist die abgeschnittene Wahrscheinlichkeit

$$ \ Phi _ {\ text {abgeschnitten}} ((a, b]) = \ Phi ((a, b]) / \ Phi ([0, \ infty]) = 2 \ Phi ((a, b]) $$

(weil $ \ Phi ([0, \ infty]) = 1/2 $) und die gefaltete Wahrscheinlichkeit ist

$$ \ Phi _ {\ text {gefaltet}} ((a, b]) = \ Phi ((a, b]) + \ Phi ([- b, -a)) = 2 \ Phi ( (a, b]) $$

aufgrund der Symmetrie von $ \ Phi $ ungefähr $ 0 $.

Diese Analyse gilt für jede Verteilung symmetrisch um $ 0 $ und hat eine Wahrscheinlichkeit von Null, $ 0 $ zu sein. Wenn der Mittelwert ungleich Null ist , ist die Verteilung jedoch nicht symmetrisch und die beiden Ansätze liefern nicht dasselbe Ergebnis, wie die gleichen Berechnungen zeigen.

Drei Verteilungen

Dieses Diagramm zeigt die Wahrscheinlichkeitsdichtefunktionen für eine Normalverteilung (1,1) (gelb), eine gefaltete Normalverteilung (1,1) (rot) und abgeschnittene Normalverteilung (1,1) (blau). Beachten Sie, dass die gefaltete Verteilung die charakteristische Glockenkurvenform nicht mit den beiden anderen teilt. Die blaue Kurve (abgeschnittene Verteilung) ist der positive Teil der gelben Kurve, skaliert auf Flächeneinheit, während die rote Kurve (gefaltete Verteilung) die Summe des positiven Teils der gelben Kurve und ihres negativen Endes (wie reflektiert) ist die y-Achse).

Kommentare

  • Ich mag das Bild.

Antwort

Sei $ X \ sim N (\ mu = 1, SD = 1) $. Die Verteilung von $ X | X > 0 $ ist definitiv nicht die gleiche wie die von $ | X | $.

Ein schneller Test in R:

x <- rnorm(10000, 1, 1) par(mfrow=c(2,1)) hist(abs(x), breaks=100) hist(x[x > 0], breaks=100) 

Dies ergibt Folgendes. Simulationshistogramme

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.