Dzisiaj natknąłem się na nowy temat o nazwie Oczekiwania matematyczne. Książka, którą śledzę, mówi, że oczekiwanie jest średnią arytmetyczną zmiennej losowej pochodzącej z dowolnego rozkładu prawdopodobieństwa. Ale definiuje oczekiwanie jako sumę iloczynu pewnych danych i ich prawdopodobieństwa. Jak te dwie rzeczy (średnia i oczekiwanie) mogą być takie same? Jak suma prawdopodobieństwa pomnożona przez dane może być średnią całego rozkładu?
Odpowiedź
Nieformalnie rozkład prawdopodobieństwa określa względna częstość wyników zmiennej losowej – wartość oczekiwaną można traktować jako średnią ważoną tych wyników (ważoną częstotliwością względną). Podobnie, wartość oczekiwaną można traktować jako średnią arytmetyczną zbioru liczb generowanych dokładnie proporcjonalnie do ich prawdopodobieństwa wystąpienia (w przypadku ciągłej zmiennej losowej nie jest to „t dokładnie prawdą, ponieważ określone wartości mają prawdopodobieństwo $ 0 $).
Związek między wartością oczekiwaną a średnią arytmetyczną jest najbardziej wyraźny w przypadku dyskretnej zmiennej losowej, gdzie oczekiwana wartość to
$$ E ( X) = \ sum_ {S} x P (X = x) $$
gdzie $ S $ jest przestrzenią próbną. Jako przykład, załóżmy, że masz dyskretną zmienną losową $ X $ taką, że:
$$ X = \ begin {cases} 1 & \ mbox {z prawdopodobieństwem} 1/8 \\ 2 & \ mbox {z prawdopodobieństwem} 3/8 \\ 3 & \ mbox {z prawdopodobieństwem} 1/2 \ end {cases} $$
Oznacza to, że funkcja masy prawdopodobieństwa to $ P (X = 1) = 1/8 $, $ P (X = 2) = 3/8 $ i $ P (X = 3) = 1/2 $. wzór powyżej, oczekiwana wartość to
$$ E (X) = 1 \ cdot (1/8) + 2 \ cdot (3/8) + 3 \ cd ot (1/2) = 2,375 $$
Rozważmy teraz liczby wygenerowane z częstotliwościami dokładnie proporcjonalnymi do funkcji masy prawdopodobieństwa – na przykład zbiór liczb $ \ {1,1,2,2,2 , 2,2,2,3,3,3,3,3,3,3,3 \} $ – dwa $ 1 $ s, sześć $ 2 $ s i osiem $ 3 $ s. Teraz weź średnią arytmetyczną z tych liczb:
$$ \ frac {1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 +3} {16} = 2,375 $$
i widać, że jest dokładnie równa oczekiwanej wartości.
Komentarze
- Czy nie ' t lepiej to zilustrować za pomocą prostszego zestawu {1,2,2,2,3,3,3,3}? Wyrażenie przedstawiające arytmetykę średnia tego zbioru jest identyczna z wyrażeniem pokazującym oczekiwaną wartość tej zmiennej (jeśli przekonwertujesz produkty ważone na proste sumy).
- Re: ” wyrażenie pokazujące średnią arytmetyczną tego zbioru jest identyczne z wyrażeniem pokazującym wartość oczekiwaną tej zmiennej (jeśli przekonwertujesz produkty ważone na proste sumy) ” – Tak @Dancrumb, to było cały punkt 🙂
Odpowiedź
Oczekiwanie to średnia wartość lub średnia zmiennej losowej, a nie prawdopodobieństwo Dystrybucja jako taka jest dla dyskretnych Zmienne losowe średnia ważona wartości, jakie przyjmuje zmienna losowa, gdzie ważenie jest zgodne ze względną częstotliwością występowania tych indywidualnych wartości. Dla absolutnie ciągłej zmiennej losowej jest to całka wartości x pomnożona przez gęstość prawdopodobieństwa. Obserwowane dane można postrzegać jako wartości zbioru niezależnych zmiennych losowych o identycznym rozkładzie. Średnia próbka (lub oczekiwanie próby) jest definiowana jako oczekiwanie danych w odniesieniu do rozkładu empirycznego obserwowanych danych. To sprawia, że jest to po prostu średnia arytmetyczna danych.
Komentarze
- +1. Dobry chwyt re: ” Oczekiwanie to średnia wartość lub średnia zmiennej losowej, a nie rozkład prawdopodobieństwa „. Nie ' nie zauważyłem tego subtelnego niewłaściwego użycia terminologii.
Odpowiedź
Zwróćmy szczególną uwagę na definicje:
Średnia jest zdefiniowana jako suma zbioru liczb podzielona przez liczbę liczb w zbiorze. Obliczenie byłoby następujące: „dla i w 1 do n, (suma x sub i) podzielona przez n. „
Wartość oczekiwana (EV) to długookresowa średnia wartość powtórzeń eksperymentu, który reprezentuje. Obliczenie byłoby„ for i in 1 do n, suma zdarzenia x sub i razy jego prawdopodobieństwo (i suma wszystkich p sub i musi = 1). „
W przypadku uczciwej kostki łatwo zauważyć, że średnia i EV są takie same. Średnia – (1 + 2 + 3 + 4 + 5 + 6) / 6 – 3,5, a EV wyniesie:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = suma (p * x) = 3,50
Ale co by było, gdyby kość nie była „sprawiedliwa”. Łatwym sposobem na wykonanie niesprawiedliwej kostki byłoby wiercenie ah ole w rogu na przecięciu 4, 5 i 6 ścian.Dalej powiedzmy teraz, że prawdopodobieństwo wyrzucenia 4, 5 lub 6 na naszej nowej i ulepszonej krzywej kostce wynosi teraz 0,2, a prawdopodobieństwo wyrzucenia 1, 2 lub 3 wynosi teraz .133. Jest to to samo kość z 6 ściankami, po jednej liczbie na każdej ściance, a średnia dla tej kości to nadal 3,5. Jednak po wielokrotnym rzucie tą kością nasze EV wynosi teraz 3,8, ponieważ prawdopodobieństwa zdarzeń nie są już takie same dla wszystkich wydarzeń.
problem xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0.200 5 1,00
0.200 6 1,20
EV = suma (p * x) = 3,80
Powtórzmy uważaj i wróć do definicji, zanim stwierdzisz, że jedna rzecz zawsze będzie „taka sama” jak inna. Przyjrzyj się, jak ustawia się normalną kostkę, wywierć dziurę w pozostałych 7 rogach i zobacz, jak zmieniają się pojazdy elektryczne – baw się dobrze.
Bob_T
Odpowiedź
Jedyna różnica między „średnią” a „wartością oczekiwaną” polega na tym, że średnia jest używana głównie do rozkładu częstotliwości, a oczekiwanie do rozkładu prawdopodobieństwa. W rozkładzie częstotliwości przestrzeń próbna składa się ze zmiennych i częstotliwości ich występowania. W rozkładzie prawdopodobieństwa przestrzeń próbna składa się ze zmiennych losowych i ich prawdopodobieństw. Teraz wiemy, że całkowite prawdopodobieństwo wszystkich zmiennych w przestrzeni prób musi wynosić = 1. W tym tkwi podstawowa różnica. Mianownik dla oczekiwania zawsze wynosi 1. (tj. suma f (xi) = 1) Jednak nie ma takich ograniczeń w sumowaniu częstotliwości (która jest w zasadzie całkowitą liczbą wpisów).