I dag kom jeg over et nytt tema som heter Matematisk forventning. Boken jeg følger sier, forventning er det aritmetiske gjennomsnittet av tilfeldig variabel som kommer fra enhver sannsynlighetsfordeling. Men det definerer forventning som summen av produktet av noen data og sannsynligheten for det. Hvordan kan disse to (gjennomsnitt og forventning) være like? Hvordan kan summen av sannsynlighet ganger dataene være gjennomsnittet av hel fordeling?
Svar
Uformelt definerer en sannsynlighetsfordeling relativ frekvens av utfall av en tilfeldig variabel – den forventede verdien kan betraktes som et vektet gjennomsnitt av disse utfallene (vektet av den relative frekvensen). På samme måte kan den forventede verdien betraktes som det aritmetiske gjennomsnittet av et sett med tall generert i nøyaktig proporsjon med sannsynligheten for å forekomme (i tilfelle av en kontinuerlig tilfeldig variabel er dette ikke «t spesifikke verdier har sannsynlighet $ 0 $).
Forbindelsen mellom forventet verdi og det aritmetiske gjennomsnittet er tydeligst med en diskret tilfeldig variabel, der den forventede verdien er
$$ E ( X) = \ sum_ {S} x P (X = x) $$
der $ S $ er prøveområdet. Anta at du har en diskret tilfeldig variabel $ X $ slik at:
$$ X = \ begin {cases} 1 & \ mbox {med sannsynlighet} 1/8 \\ 2 & \ mbox {med sannsynlighet} 3/8 \\ 3 & \ mbox {med sannsynlighet} 1/2 \ end {cases} $$
Det vil si at sannsynlighetsmassefunksjonen er $ P (X = 1) = 1/8 $, $ P (X = 2) = 3/8 $ og $ P (X = 3) = 1/2 $. formel ovenfor er den forventede verdien
$$ E (X) = 1 \ cdot (1/8) + 2 \ cdot (3/8) + 3 \ cd ot (1/2) = 2.375 $$
Vurder nå tall generert med frekvenser nøyaktig proporsjonalt med sannsynlighetsmassefunksjonen – for eksempel settet med tall $ \ {1,1,2,2,2 , 2,2,2,3,3,3,3,3,3,3,3 \} $ – to $ 1 $ s, seks $ 2 $ s og åtte $ 3 $ s. Ta nå det aritmetiske gjennomsnittet av disse tallene:
$$ \ frac {1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 +3} {16} = 2.375 $$
, og du kan se at den er nøyaktig lik den forventede verdien.
Kommentarer
- Ville ‘ ikke dette illustreres bedre ved å bruke det enklere settet med {1,2,2,2,3,3,3,3}} Uttrykket som viser aritmetikk gjennomsnittet for det settet er identisk med uttrykket som viser forventningsverdien til den variabelen (hvis du konverterer de vektede produktene til enkle summer).
- Re: » uttrykk som viser aritmetisk gjennomsnitt av det settet, er identisk med uttrykket som viser forventningsverdien til den variabelen (hvis du konverterer de vektede produktene til enkle summer) » – Ja @Dancrumb, det var hele poenget 🙂
Svar
Forventningen er gjennomsnittsverdien eller gjennomsnittet av en tilfeldig variabel, ikke en sannsynlighet distribusjon. Som sådan er det for diskret tilfeldige variabler det vektede gjennomsnittet av verdiene den tilfeldige variabelen får der vektingen er i henhold til den relative hyppigheten av forekomst av disse individuelle verdiene. For en absolutt kontinuerlig tilfeldig variabel er det integralen av verdiene x multiplisert med sannsynlighetstettheten. Observerte data kan sees på som verdiene til en samling av uavhengige identisk fordelte tilfeldige variabler. Eksempelgjennomsnittet (eller prøveforventningen) er definert som forventningen til dataene med hensyn til den empiriske fordelingen for de observerte dataene. Dette gjør det ganske enkelt det aritmetiske gjennomsnittet av dataene.
Kommentarer
- +1. God fangst re: » Forventningen er gjennomsnittsverdien eller gjennomsnittet av en tilfeldig variabel, ikke en sannsynlighetsfordeling «. Jeg la ikke ‘ ikke merke til dette subtile misbruket av terminologi.
Svar
La oss være nøye med definisjonene:
Gjennomsnitt er definert som summen av en samling av tall delt på antall tall i samlingen. Beregningen vil være «for i i 1 til n, (sum av x sub i) delt på n. «
Forventet verdi (EV) er den langsiktige gjennomsnittsverdien av repetisjoner av eksperimentet den representerer. Beregningen vil være» for i i 1 til n, summen av hendelsen x sub i ganger sannsynligheten (og summen av alle p sub i må = 1). «
I tilfelle en rettferdig død, er det lett å se at gjennomsnitt og EV er de samme. Gjennomsnitt – (1 + 2 + 3 + 4 + 5 + 6) / 6 – 3.5 og EV vil være:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = sum (p * x) = 3,50
Men hva om matrisen ikke var «rettferdig.» En enkel måte å lage en urettferdig matte ville være å bore ah ole i hjørnet i skjæringspunktet mellom 4, 5 og 6 ansikter.La oss nå si at sannsynligheten for å rulle en 4, 5 eller 6 på vår nye og forbedrede skjeve dyse er nå .2 og sannsynligheten for å rulle en 1, 2 eller 3 er nå .133. Det er det samme dø med 6 ansikter, ett nummer på hvert ansikt, og gjennomsnittet for denne døen er fortsatt 3,5. Etter å ha rullet denne døren mange ganger, er vår EV nå 3,8 fordi sannsynligheten for hendelsene ikke lenger er den samme for alle hendelser. / p>
prob xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = sum (p * x) = 3,80
Igjen, la oss være forsiktig og gå tilbake til definisjonen før du konkluderer med at en ting alltid vil være «den samme» som en annen. Ta en titt på hvordan en vanlig matrise er satt opp og bor et hull i de andre 7 hjørnene og se hvordan EV-ene endres – ha det gøy.
Bob_T
Svar
Den eneste forskjellen mellom «middel» og «forventet verdi» er at gjennomsnittet hovedsakelig brukes for frekvensfordeling og forventning brukes for sannsynlighetsfordeling. I frekvensfordeling består prøveområdet av variabler og deres forekomstfrekvenser. I sannsynlighetsfordeling består prøveområdet av tilfeldige variabler og deres sannsynlighet. Nå vet vi at total sannsynlighet for alle variabler i prøveområdet må være = 1. Her ligger den grunnleggende forskjellen. Nevnerens betegnelse på forventning er alltid = 1. (dvs. Summation f (xi) = 1) Ingen slike begrensninger på frekvenssammendrag (som i utgangspunktet er totalt antall poster).