Wikipedia sier :

For det andre og høyere øyeblikk brukes vanligvis de sentrale øyeblikkene (øyeblikk om gjennomsnittet, med c som gjennomsnittet) i stedet for øyeblikkene om null, fordi de gir klarere informasjon om fordelingsformen.

Kan noen forklare / overbevise meg om hvorfor dette er sant? Hvorfor er det avvik?
Dette har alltid bugget meg, og jeg har aldri sett en god forklaring på det – jeg forstår ikke helt hvorfor / hvordan standardisering gir «klar» informasjon i ett tilfelle, men ikke i en annen.

For eksempel:

  1. For å beregne skjevheten, hvorfor ikke standardisere både gjennomsnittet og avviket?
  2. For å beregne kurtosen, hvorfor ikke standardisere gjennomsnittet, variansen, og skjevheten?
  3. Til beregne n th øyeblikket, hvorfor ikke først standardisere alle m th øyeblikkene for m < n?
    Hvis standardisering er nyttig, så hvorfor bare gjøre dette for m = 1?

Kommentarer

  • Hvordan forstår du » form «? Jeg tar det som samlingen av alle egenskapene til en distribusjon som ikke endres av noen endring av plassering eller skala – med andre ord, egenskaper som vedvarer i en graf for fordelingen når alle akse merker blir slettet. Hvis du deler denne forståelsen, bør (a) svaret på spørsmålet ditt bli åpenbart, og (b) det vil være tydelig at sentrale øyeblikk ikke er den eneste måten å løse problemet med å beskrive former på; de er bare en måte å etablere en plassering og skala for (de fleste) distribusjoner på.
  • Ordet » normaliserer » er en av mange innen statistikk som endrer mening fra felt til felt, i den grad det er farlig. Å bruke det til å antyde » mener-subtraherte » er ikke ‘ t standard for mange av oss . Jeg ville overgå kunnskapen min og si at det ikke er standard for alle, men jeg utfordrer deg til å sitere litteratur der » normaliserer » er identisk med » trekker gjennomsnittet «.
  • » Den andre typen normalisering kommer fra statistikk, og eliminerer måleenheten ved å transformere dataene til nye poeng med et gjennomsnitt på 0 og et standardavvik på 1 . » @NickCox Jeg tror min bruk av ordet ikke var ‘ t for outlandish og var nok fornuftig til å få poenget over, så la ‘ s ikke gå på en tangens her.
  • Beklager; at ‘ ikke er det jeg spurte. Spørsmålet ditt var hvorfor bruke øyeblikk om gjennomsnittet i stedet for øyeblikk om null. For eksempel er det andre øyeblikket om gjennomsnittet variansen; den ‘ er ikke skalert av standardavviket. Naturligvis er jeg enig i at skjevhet og kurtose ofte defineres som momentforhold, noe som tilsvarer skalering med standardavviket, men ingen av dem er nevnt i spørsmålet ditt i det hele tatt. Kort sagt handler kommentaren min om formuleringen i spørsmålet ditt. Du ‘ har gitt bevis for min påstand, ettersom å trekke gjennomsnitt og dele med SD ofte kalles standardisering.
  • Jeg gjorde ikke ‘ t si at jeg følte meg forvirret; Dessverre er jeg fortsatt av den oppfatning at den presise importen av spørsmålet ditt sannsynligvis vil være uklart for andre. Et papir med veiledningssmak på stata-journal.com/sjpdf.html?articlenum=st0204 kan ha interesse for folk som er nysgjerrige på øyeblikk.

Svar

Siden spørsmålet ble oppdatert, oppdaterer jeg svaret mitt:

Den første delen (For å beregne skjevhet, hvorfor ikke standardisere både gjennomsnittet og variansen?) er enkelt: Det er nettopp slik det gjøres! Se definisjonene av skjevhet og kurtosis i wiki.

Den andre delen er både enkel og vanskelig. På den ene siden kan vi si at det er umulig å normalisere tilfeldig variabel for å tilfredsstille tre momentforhold, som lineær transformasjon $ X \ til aX + b $ bare tillater to. Men på den annen side, hvorfor skal vi begrense oss til lineære transformasjoner? Visst, forskyvning og skala er langt den mest fremtredende (kanskje fordi de er tilstrekkelig mesteparten av tiden, si for grenseordninger), men hva med høyere ordens polynomer eller tar logger, eller trengs med seg selv?Er det ikke hva Box-Cox-transformasjon handler om – å fjerne skjevhet?

Men når det gjelder mer kompliserte transformasjoner, tror jeg, konteksten og selve transformasjonen blir viktig, så kanskje det er derfor det ikke er flere «øyeblikk med navn». Det betyr ikke at RV ikke blir transformert og at øyeblikkene ikke beregnes, tvert imot. Du valgte bare transformasjonen din, beregne hva du trenger og gå videre.


Det gamle svaret om hvorfor sentraliserte øyeblikk representerer form bedre enn rå:

Nøkkelordet er form . Som whuber antydet, etter form vil vi vurdere egenskapene til fordelingen som er uforanderlige for oversettelse og skalering. Det vil si at når du vurderer variabelen $ X + c $ i stedet for $ X $, får du den samme distribusjonsfunksjonen (bare skiftet til høyre eller venstre), så vi ønsker å si at formen forble den samme.

De rå øyeblikkene endres når du oversetter variabelen, så de gjenspeiler ikke bare formen, men en Også et sted. Faktisk kan du ta en vilkårlig variabel, og flytte den $ X \ til X + c $ på riktig måte for å få noen verdi for det, for eksempel, det rå tredje øyeblikket.

Den samme observasjonen gjelder for alle rare øyeblikk. og i mindre grad for jevne øyeblikk (de er avgrenset nedenfra og nedre grense avhenger av form).

Det sentraliserte øyeblikket, derimot, endres ikke når du oversetter variabelen, slik at » s hvorfor de er mer beskrivende for formen. For eksempel, hvis det jevne sentraliserte øyeblikket ditt er stort, visste du at den tilfeldige variabelen har en masse som ikke er for nær å bety. Eller hvis det merkelige øyeblikket ditt er null, visste du at den tilfeldige variabelen har noen symmetri rundt gjennomsnittet.

Det samme argumentet strekker seg til skala, som er transformasjon $ X \ til cX $. Den vanlige normaliseringen i dette tilfellet er inndeling etter standardavvik, og de tilsvarende øyeblikkene kalles normaliserte øyeblikk, i det minste av wikipedia .

Kommentarer

  • Kan du forklare deg din påstand om » flytte den rundt for å få en verdi av tredje øyeblikk «? Hva mener du nøyaktig med » flytt den rundt, » hvilken betydning har denne operasjonen for distribusjon form , og hvorfor endrer det tredje øyeblikk?
  • Jada: med å bevege meg mente jeg oversettelser $ X \ til X + c $. Det endrer åpenbart verdien av det tredje øyeblikket, og du kan få den til å være lik hvilken verdi som helst. Det endrer ikke formen på distribusjonen med den fine definisjonen av formen ovenfor.
  • Ah … du mener det tredje øyeblikket i stedet for det sentrale tredje øyeblikket. I denne sammenhengen, hvor vi diskuterer flere slags øyeblikk, mistet jeg oversikten over hvilken du egentlig mente. Feillesing var sikkert min feil, men når du endrer dette innlegget for å avklare hva » flytter det, betyr det «, kan du vurdere å gjøre litt ekstra mindre endringer for å forhindre at andre faller i samme felle.
  • (+1) Tusen takk for at du gjorde dette til et veldig klart, autoritativt innlegg.
  • Aaahh! Nå forstår jeg. Spørsmålet er: hvorfor ikke ‘ t vi normaliserer ved å for eksempel si at det tredje øyeblikket var lik null, og at det tiende var lik ett? OK, at ‘ er et helt annet spørsmål, la meg tenke på det 🙂

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *