Hvorfor er det første øjeblik standardiseret inden beregning af højere øjeblikke, men højere øjeblikke er det ikke?

Wikipedia siger :

For det andet og højere øjeblikke bruges de centrale øjeblikke (øjeblikke om middelværdien, hvor c er middelværdien) normalt i stedet for øjeblikke omkring nul, fordi de giver klarere information om fordelingsformen.

Kunne nogen forklare / overbevise mig om, hvorfor dette er sandt? Hvorfor er der uoverensstemmelse?
Dette har altid bugget mig, og jeg har aldrig set en god forklaring på det – jeg forstår ikke helt hvorfor / hvordan standardisering giver “klare” oplysninger i et tilfælde, men ikke i en anden.

For eksempel:

For at beregne skævheden, hvorfor ikke standardisere både middelværdien og variansen?
For at beregne kurtosen, hvorfor ikke standardisere middelværdien, variansen, og skævheden?
…
Til beregne n ^th øjeblikket, hvorfor ikke først standardisere alle m ^th øjeblikke til m < n?
Hvis standardisering er nyttigt så hvorfor kun gøre dette for m = 1?

Kommentarer

Hvordan forstår du ” form “? Jeg antager, at det er samlingen af alle egenskaber for en distribution, der ikke ændres af nogen ændring af placering eller skala – med andre ord egenskaber, der vedvarer i en graf for fordelingen, når alle aksemærker slettes. Hvis du deler denne forståelse, skal (a) svaret på dit spørgsmål blive indlysende, og (b) det vil være tydeligt, at centrale øjeblikke ikke er den eneste måde at løse problemet med at beskrive figurer på; de er kun en måde at etablere en placering og skala for (de fleste) distributioner.
Ordet ” normaliserer ” er en af mange inden for statistisk videnskab, der ændrer betydning fra felt til felt, i det omfang det er farligt. Brug af det til at antyde ” middel-subtraheret ” er ikke ‘ t standard for mange af os . Jeg ville overskride min viden for at sige, at det ikke er standard for alle, men jeg udfordrer dig til at citere litteratur, hvor ” normaliserer ” er identisk med ” trækker middelværdien “.
” Den anden type normalisering stammer fra statistikker og eliminerer måleenheden ved at omdanne dataene til nye scores med et gennemsnit på 0 og en standardafvigelse på 1 . ” @NickCox Jeg tror, at min brug af ordet ikke var ‘ t er for mærkelig og giver mening nok til at få pointen videre, så lad ‘ ikke gå på en tangens her.
Undskyld; at ‘ ikke er hvad jeg spurgte. Dit spørgsmål var hvorfor bruge øjeblikke om middelværdien snarere end øjeblikke om nul. For eksempel er det andet øjeblik omkring middelværdien variansen; det ‘ er ikke skaleret af standardafvigelsen. Naturligvis er jeg enig i, at skævhed og kurtose ofte defineres som momentforhold, hvilket svarer til skalering ved hjælp af standardafvigelsen, men ingen af dem nævnes overhovedet i dit spørgsmål. Kort sagt handler min kommentar om ordlyden i dit spørgsmål. Du ‘ har fremlagt bevis for min påstand, da fratrækning af gennemsnit og deling med SD almindeligvis kaldes standardisering.
Jeg gjorde ikke ‘ t siger, at jeg følte mig forvirret; desværre er jeg fortsat af den opfattelse, at den nøjagtige import af dit spørgsmål sandsynligvis vil være uklar for andre. Et papir med tutorial-smag på stata-journal.com/sjpdf.html?articlenum=st0204 kan have interesse for folk, der er nysgerrige efter øjeblikke.

Svar

Da spørgsmålet blev opdateret, opdaterer jeg mit svar:

Den første del (At beregne skævhed, hvorfor ikke standardisere både middelværdien og variansen?) er let: Det er netop sådan, det er gjort! Se definitionerne af skævhed og kurtosis i wiki.

Anden del er både let og hård. På den ene side kan vi sige, at det er umuligt at normalisere tilfældig variabel for at tilfredsstille tre øjeblikkeforhold, da lineær transformation $ X \ til aX + b $ kun tillader to. Men på den anden side, hvorfor skal vi begrænse os til lineære transformationer? Sikker på, forskydning og skala er langt den mest fremtrædende (måske fordi de er tilstrækkelig det meste af tiden, sig for grænsesætninger), men hvad med højere ordens polynomer eller tager logfiler, eller trænger sammen med sig selv?Faktisk er det ikke hvad Box-Cox-transformation handler om – at fjerne skæv?

Men i tilfælde af mere komplicerede transformationer, tror jeg, konteksten og selve transformationen bliver vigtig, så måske det er derfor, der ikke er flere “øjeblikke med navne”. Det betyder ikke, at RVer ikke transformeres, og at øjeblikke ikke beregnes, tværtimod. Du valgte bare din transformation, beregne hvad du har brug for og gå videre.

Det gamle svar om, hvorfor centraliserede øjeblikke repræsenterer form bedre end rå:

Nøgleordet er form . Som whuber antydet, efter form vil vi overveje egenskaber ved distributionen, der er uændrede i forhold til oversættelse og skalering. Det vil sige, når du overvejer variablen $ X + c $ i stedet for $ X $, får du den samme fordelingsfunktion (bare skiftet til højre eller venstre), så vi vil gerne at sige, at dens form forblev den samme.

De rå øjeblikke ændres, når du oversætter variablen, så de reflekterer ikke kun formen, men en også et sted. Faktisk kan du tage en vilkårlig tilfældig variabel og skifte den $ X \ til X + c $ passende for at få en værdi for sit, siger rå tredje øjeblik.

Den samme observation gælder for alle ulige øjeblikke og i mindre grad for lige øjeblikke (de er afgrænset nedenfra og nedre grænse afhænger af form).

Det centraliserede øjeblik ændres derimod ikke, når du oversætter variablen, så ” s hvorfor de er mere beskrivende for formen. F.eks. hvis dit endda centraliserede øjeblik er stort, vidste du, at tilfældig variabel har en masse, der ikke er for tæt på at betyde. Eller hvis dit ulige øjeblik er nul, vidste du, at din tilfældige variabel har en eller anden symmetri omkring middelværdi.

Det samme argument strækker sig til skala, hvilket er transformation $ X \ til cX $. Den sædvanlige normalisering i dette tilfælde er division ved standardafvigelse, og de tilsvarende øjeblikke kaldes normaliserede øjeblikke, i det mindste af wikipedia .

Kommentarer

Kan du forklare dig din påstand om ” flytte den rundt for at få en værdi af tredje øjeblik “? Hvad mener du nøjagtigt med ” flyt det rundt, ” hvilken indflydelse har denne operation på fordelingsform , og hvorfor ændrer det tredje øjeblik?
Sikker på: ved at bevæge mig mente jeg oversættelser $ X \ til X + c $. Det ændrer naturligvis værdien af det tredje øjeblik, og du kan få det til at være lig med hvilken værdi som helst. Det ændrer ikke formen på fordelingen ved din flotte definition af formen ovenfor.
Ah … du mener det rå tredje øjeblik snarere end det centrale tredje øjeblik. I denne sammenhæng, hvor vi diskuterer flere slags øjeblikke, mistede jeg styr på, hvilken du faktisk mente. Denne fejllæsning var bestemt min skyld, men når du ændrer dette indlæg for at afklare, hvad ” flytter det rundt, betyder det “, kan du overveje at gøre noget ekstra mindre redigeringer for at forhindre andre i at falde i samme fælde.
(+1) Mange tak for at gøre dette til et virkelig klart, autoritativt indlæg.
Aaahh! Nu forstår jeg det. Spørgsmålet er: hvorfor don ‘ t vi normaliserer ved at sige, at det tredje øjeblik var lig med nul, og at det tiende var lig med et? OK, at ‘ er et helt andet spørgsmål, lad mig tænke over det 🙂

Kommentarer

Svar

Kommentarer

Skriv et svar Annuller svar