Wikipedia säger :

För det andra och högre ögonblick används vanligtvis de centrala ögonblicken (ögonblick om medelvärdet, med c är medelvärdet) snarare än ögonblicken om noll, eftersom de ger tydligare information om fördelningens form.

Kan någon förklara / övertyga mig om varför detta är sant? Varför finns det en skillnad?
Detta har alltid buggat mig och jag har aldrig sett en bra förklaring till det – jag förstår inte helt varför / hur standardisering ger ”tydlig” information i ett fall men inte i en annan.

Till exempel:

  1. För att beräkna snedställningen, varför inte standardisera både medelvärdet och variansen?
  2. För att beräkna kurtosen, varför inte standardisera medelvärdet, variansen, och skevheten?
  3. Till beräkna n th ögonblicket, varför inte först standardisera alla m th ögonblicken för m < n?
    Om standardisering är användbart då varför bara göra detta för m = 1?

Kommentarer

  • Hur förstår du ” form ”? Jag antar att det är samlingen av alla egenskaper i en distribution som inte ändras av någon förändring av plats eller skala – med andra ord, egenskaper som kvarstår i ett diagram över fördelningen när alla axelmärken raderas. Om du delar denna förståelse bör (a) svaret på din fråga bli uppenbart och (b) det kommer att vara uppenbart att centrala ögonblick inte är det enda sättet att lösa problemet med att beskriva former; de är bara ett sätt att skapa en plats och skala för (de flesta) distributioner.
  • Ordet ” normalisera ” är en av många inom statistik som ändrar betydelse från fält till fält, i den mån det är farligt. Att använda den för att antyda ” medel subtraherad ” är inte ’ t standard för många av oss . Jag skulle överträffa min kunskap att säga att det inte är standard för alla, men jag utmanar er att citera litteratur där ” normaliserar ” är identisk med ” subtrahera medelvärdet ”.
  • ” Den andra typen av normalisering härstammar från statistik och eliminerar måttenheten genom att omvandla data till nya poäng med ett medelvärde på 0 och en standardavvikelse på 1 . ” @NickCox Jag tror att min användning av ordet inte var ’ inte för outlandish och tillräckligt vettigt för att få fram poängen, så låt ’ inte gå på en tangent här.
  • Ledsen; att ’ inte är vad jag frågade. Din fråga var varför använda stunder om medelvärdet snarare än stunder om noll. Till exempel är det andra ögonblicket om medelvärdet variansen; den ’ är inte skalad av standardavvikelsen. Naturligtvis håller jag med om att skevhet och kurtos ofta definieras som momentförhållanden, vilket motsvarar skalning med standardavvikelsen också, men inget nämns i din fråga alls. Kort sagt, min kommentar handlar om formuleringen i din fråga. Du ’ har gett bevis för mitt påstående, eftersom subtrahering av medelvärde och delning med SD brukar kallas standardisering.
  • Jag gjorde inte ’ t säga att jag kände mig förvirrad; tyvärr är jag fortfarande av uppfattningen att den exakta importen av din fråga sannolikt kommer att vara oklar för andra. Ett papper med handledningssmak på stata-journal.com/sjpdf.html?articlenum=st0204 kan ha intresse för människor som är nyfikna på stunder.

Svar

Eftersom frågan uppdaterades uppdaterar jag mitt svar:

Den första delen (Att beräkna skevhet, varför inte standardisera både medelvärdet och variansen?) är lätt: Det är precis så det är gjort! Se definitionerna av skevhet och kurtosis i wiki.

Den andra delen är både enkel och hård. Å ena sidan kan vi säga att det är omöjligt att normalisera slumpmässig variabel för att tillfredsställa tre momentförhållanden, eftersom linjär transformation $ X \ till aX + b $ endast tillåter två. Men å andra sidan, varför ska vi begränsa oss till linjära transformationer? Visst, skift och skala är överlägset mest framträdande (kanske för att de är tillräckligt för det mesta, säg för gränssatser), men vad sägs om högre ordningspolynom eller ta stockar, eller samarbeta med sig själv?Är det faktiskt inte vad Box-Cox-transformering handlar om – att ta bort skevhet?

Men när det gäller mer komplicerade transformationer, tror jag, sammanhanget och själva transformationen blir viktigt, så kanske det är därför det inte finns fler ”ögonblick med namn”. Det betyder inte att rvs inte transformeras och att ögonblicken inte beräknas, tvärtom. Du valde bara din transformation, beräkna vad du behöver och gå vidare.


Det gamla svaret om varför centraliserade ögonblick representerar form bättre än råa:

Nyckelordet är form . Som whuber föreslog, efter form vill vi överväga egenskaper hos distributionen som är oförändrade för översättning och skalning. Det vill säga när du tänker på variabeln $ X + c $ istället för $ X $ får du samma fördelningsfunktion (flyttas bara till höger eller vänster), så vi skulle vilja att säga att dess form förblev densamma.

De råa ögonblicken ändras när du översätter variabeln, så de återspeglar inte bara formen utan också en också en plats. I själva verket kan du ta vilken slumpmässig variabel som helst och flytta den $ X \ till X + c $ på lämpligt sätt för att få något värde för dess, till exempel, råa tredje ögonblick.

Samma observation gäller för alla udda ögonblick. och i mindre utsträckning för jämna ögonblick (de är avgränsade underifrån och nedre gränsen beror på form).

Det centraliserade ögonblicket å andra sidan ändras inte när du översätter variabeln, så att ” s varför de är mer beskrivande för formen. Om ditt till och med centraliserade ögonblick till exempel är stort, visste du att slumpvariabeln har en massa som inte är för nära att betyda. någon symmetri kring medelvärdet.

Samma argument sträcker sig till skala, vilket är transformation $ X \ till cX $. Den vanliga normaliseringen i detta fall är division med standardavvikelse, och motsvarande moment kallas normaliserade moment, åtminstone av wikipedia .

Kommentarer

  • Kan du förklara dig ditt påstående om ” flytta det runt för att få något värde av tredje ögonblicket ”? Vad menar du exakt med ” flytta det runt, ” vilken betydelse denna operation har för fördelnings form , och varför ändrar det tredje ögonblicket?
  • Visst: genom att flytta runt menade jag översättningar $ X \ till X + c $. Det ändrar självklart värdet på det tredje ögonblicket och du kan få det att vara lika med vilket värde som helst. Det ändrar inte formen på fördelningen med din fina definition av formen ovan.
  • Ah … du menar tredje ögonblicket snarare än det centrala tredje ögonblicket. I det här sammanhanget, där vi diskuterar flera olika stunder, tappade jag koll på vilken du egentligen menade. Att felläsa var säkert mitt fel, men när du ändrar det här inlägget för att klargöra vad ” flyttar det runt betyder det ” kan du överväga att göra lite ytterligare mindre ändringar för att förhindra att andra faller i samma fälla.
  • (+1) Stort tack för att du gjorde detta till ett riktigt tydligt, auktoritativt inlägg.
  • Aaahh! Nu fattar jag. Frågan är: varför don ’ t vi normaliserar genom att säga att det tredje ögonblicket var lika med noll och att det tionde var lika med ett? OK, att ’ är en helt annan fråga, låt mig tänka på det 🙂

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *