Idag kom jag över ett nytt ämne som heter Matematisk förväntan. Boken jag följer säger att förväntningar är det aritmetiska medelvärdet av slumpmässig variabel som kommer från någon sannolikhetsfördelning. Men det definierar förväntan som summan av produkten av vissa data och sannolikheten för det. Hur kan dessa två (genomsnitt och förväntningar) vara desamma? Hur kan summan av sannolikhetstiderna vara medelvärdet av hela fördelningen?
Svar
Informellt definierar en sannolikhetsfördelning relativ frekvens för utfall av en slumpmässig variabel – det förväntade värdet kan betraktas som ett viktat medelvärde av dessa resultat (vägd med den relativa frekvensen). På samma sätt kan det förväntade värdet betraktas som det aritmetiska medelvärdet för en uppsättning siffror som genereras i exakt proportion till deras sannolikhet att inträffa (i fallet med en kontinuerlig slumpmässig variabel är detta inte ”t exakt sant eftersom specifika värden har sannolikheten $ 0 $).
Förbindelsen mellan det förväntade värdet och det aritmetiska medelvärdet är tydligast med en diskret slumpmässig variabel, där det förväntade värdet är
$$ E ( X) = \ sum_ {S} x P (X = x) $$
där $ S $ är provutrymmet. Anta att du har en diskret slumpmässig variabel $ X $ så att:
$$ X = \ begin {cases} 1 & \ mbox {med sannolikhet} 1/8 \\ 2 & \ mbox {med sannolikhet} 3/8 \\ 3 & \ mbox {med sannolikhet} 1/2 \ end {cases} $$
Sannolikhetsmassfunktionen är $ P (X = 1) = 1/8 $, $ P (X = 2) = 3/8 $ och $ P (X = 3) = 1/2 $. formel ovan är det förväntade värdet
$$ E (X) = 1 \ cdot (1/8) + 2 \ cdot (3/8) + 3 \ cd ot (1/2) = 2.375 $$
Betrakta nu siffror som genereras med frekvenser exakt proportionella mot sannolikhetsfunktionen – till exempel uppsättningen siffror $ \ {1,1,2,2,2 , 2,2,2,3,3,3,3,3,3,3,3 \} $ – två $ 1 $ s, sex $ 2 $ s och åtta $ 3 $ s. Ta nu det aritmetiska medelvärdet av dessa siffror:
$$ \ frac {1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 + 3 + 3 +3} {16} = 2.375 $$
och du kan se att den är exakt lika med det förväntade värdet.
Kommentarer
- Skulle ’ inte detta illustreras bättre genom att använda den enklare uppsättningen {1,2,2,2,3,3,3,3}? Uttrycket som visar aritmetik medelvärdet för den uppsättningen är identiskt med uttrycket som visar förväntningsvärdet för den variabeln (om du konverterar de viktade produkterna till enkla summor).
- Re: ” uttryck som visar aritmetiskt medelvärde för den uppsättningen är identiskt med uttrycket som visar förväntningsvärdet för den variabeln (om du konverterar de viktade produkterna till enkla summor) ” – Ja @Dancrumb, det var det hela punkten 🙂
Svar
Förväntningen är medelvärdet eller medelvärdet för en slumpmässig variabel inte en sannolikhet distribution som sådan är för diskret slumpmässiga variabler det viktade genomsnittet av värdena som den slumpmässiga variabeln tar på där viktningen är enligt den relativa frekvensen av förekomst av dessa enskilda värden. För en absolut kontinuerlig slumpmässig variabel är det integralen av värden x multiplicerat med sannolikhetstätheten. Observerad data kan ses som värdena för en samling oberoende identiskt fördelade slumpmässiga variabler. Provmedelvärdet (eller provförväntningen) definieras som förväntningen på data med avseende på den empiriska fördelningen för de observerade uppgifterna. Detta gör det helt enkelt det aritmetiska genomsnittet för data.
Kommentarer
- +1. Bra fångst re: ” Förväntningen är medelvärdet eller medelvärdet för en slumpmässig variabel inte en sannolikhetsfördelning ”. Jag märkte inte ’ detta subtila missbruk av terminologi.
Svar
Låt oss ägna stor uppmärksamhet åt definitionerna:
Medel definieras som summan av en samling siffror dividerat med antalet siffror i samlingen. Beräkningen skulle vara ”för i i 1 till n, (summan av x sub i) dividerat med n. ”
Förväntat värde (EV) är det långsiktiga genomsnittliga värdet av repetitioner av experimentet det representerar. Beräkningen skulle vara” för i i 1 till n, summan av händelsen x sub i gånger dess sannolikhet (och summan av alla p sub i måste = 1). ”
I fallet med en rättvis matris är det lätt att se att medelvärde och EV är samma. Medelvärde – (1 + 2 + 3 + 4 + 5 + 6) / 6 – 3,5 och EV skulle vara:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = summa (p * x) = 3,50
Men tänk om matrisen inte var ”rättvis”. Ett enkelt sätt att göra en orättvis matris skulle vara att borra ah ole i hörnet vid skärningspunkten mellan 4, 5 och 6 ansikten.Låt oss nu säga att sannolikheten för att rulla en 4, 5 eller 6 på vår nya och förbättrade krokiga matris är nu .2 och sannolikheten för att rulla en 1, 2 eller 3 är nu .133. Det är samma dö med 6 ansikten, ett nummer på varje ansikte och medelvärdet för denna dör är fortfarande 3,5. Efter att ha rullat denna dör många gånger är vår EV nu 3,8 eftersom sannolikheterna för händelserna inte längre är desamma för alla händelser.
prob xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = summa (p * x) = 3,80
Återigen, låt oss vara försiktig och gå tillbaka till definitionen innan du drar slutsatsen att en sak alltid kommer att vara ”samma” som en annan. Ta en titt på hur en vanlig matris är inställd och borra ett hål i de andra sju hörnen och se hur elbilarna förändras – ha kul.
Bob_T
Svar
Den enda skillnaden mellan ”medelvärde” och ”förväntat värde” är att medelvärdet huvudsakligen används för frekvensfördelning och förväntan används för sannolikhetsfördelning. I frekvensfördelning består provutrymme av variabler och deras frekvenser av förekomst. I sannolikhetsfördelning består provutrymme av slumpmässiga variabler och deras sannolikheter. Nu vet vi att den totala sannolikheten för alla variabler i provutrymmet måste vara = 1. Här ligger den grundläggande skillnaden. Nämnarens term för förväntan är alltid = 1. (dvs Summation f (xi) = 1) Men inga sådana begränsningar för summering av frekvens (vilket i grunden är totalt antal poster).