Waarom wordt het eerste moment gestandaardiseerd voordat hogere momenten worden berekend, maar hogere momenten niet?

Wikipedia zegt :

Voor de tweede en hogere momenten worden de centrale momenten (momenten rond het gemiddelde, waarbij c het gemiddelde is) meestal gebruikt in plaats van de momenten rond nul, omdat ze duidelijkere informatie geven over de vorm van de verdeling.

Kan iemand mij uitleggen / overtuigen waarom dit waar is? Waarom is er een discrepantie?
Dit heeft me altijd lastig gevallen en ik heb nog nooit een goede verklaring ervoor – ik begrijp gewoon niet helemaal waarom / hoe standaardisatie in één geval “duidelijke” informatie oplevert, maar niet in een andere.

Bijvoorbeeld:

Om de scheefheid te berekenen, waarom zou u beide de gemiddelde en de variantie?
Waarom zou je, om de kurtosis te berekenen, het gemiddelde, de variantie, en de scheefheid niet standaardiseren?
…
Om bereken het n ^de moment, waarom standaardiseer je niet eerst alle m ^de momenten voor m < n?
Als standaardisatie is nuttig, waarom doe je dit dan alleen voor m = 1?

Reacties

Hoe begrijp je ” vorm “? Ik neem aan dat het de verzameling is van alle eigenschappen van een distributie die niet worden gewijzigd door enige verandering van locatie of schaal – met andere woorden, eigenschappen die blijven bestaan in een grafiek van de distributie wanneer alle aslabels worden gewist. Als u dit begrip deelt, moet (a) het antwoord op uw vraag duidelijk worden en (b) het zal duidelijk zijn dat centrale momenten niet de enige manier zijn om het probleem van het beschrijven van vormen op te lossen; ze zijn slechts één manier om een locatie en schaal vast te stellen voor (de meeste) distributies.
Het woord ” normaliseert ” is een van de vele in de statistische wetenschap die van veld tot veld van betekenis verandert, voor zover het gevaarlijk is. Het gebruiken om ” mean-subtracted ” isn ‘ een standaard voor velen van ons te impliceren . Ik zou mijn kennis te boven gaan om te zeggen dat het niet-standaard is voor iedereen, maar ik daag u uit literatuur te citeren waarin ” normaliseren ” is identiek aan ” trek het gemiddelde van ” af.
” Het tweede type normalisatie komt voort uit statistieken en elimineert de meeteenheid door de gegevens om te zetten in nieuwe scores met een gemiddelde van 0 en een standaarddeviatie van 1 . ” @NickCox Ik denk dat mijn gebruik van het woord niet t te bizar en logisch genoeg om het punt duidelijk te maken, dus laat ‘ s hier niet op een raaklijn gaan.
Sorry; dat ‘ is niet wat ik vroeg. Uw vraag was waarom u momenten over het gemiddelde gebruikt in plaats van momenten over nul. Het tweede moment over het gemiddelde is bijvoorbeeld de variantie; het ‘ is niet geschaald door de standaarddeviatie. Natuurlijk ben ik het ermee eens dat scheefheid en kurtosis vaak worden gedefinieerd als momentverhoudingen, wat ook gelijk is aan schalen door de standaarddeviatie, maar geen van beide wordt in uw vraag helemaal vermeld. Kortom, mijn opmerking gaat over de bewoordingen in uw vraag. U ‘ hebt bewijs geleverd voor mijn bewering, aangezien het aftrekken van gemiddelde en delen door SD gewoonlijk standaardisatie wordt genoemd.
Ik deed het niet ‘ t zeggen dat ik me in de war voelde; helaas blijf ik van mening dat de precieze strekking van uw vraag voor anderen waarschijnlijk onduidelijk zal zijn. Een paper met tutorialsmaak op stata-journal.com/sjpdf.html?articlenum=st0204 kan interessant zijn voor mensen die nieuwsgierig zijn naar momenten.

Antwoord

Sinds de vraag is bijgewerkt, werk ik mijn antwoord bij:

Het eerste deel (om de scheefheid, waarom zou u niet zowel het gemiddelde als de variantie standaardiseren?) is eenvoudig: dat is precies hoe het moet! Zie de definities van scheefheid en kurtosis in wiki.

Het tweede deel is zowel gemakkelijk als moeilijk. Aan de ene kant zouden we kunnen zeggen dat het onmogelijk is om willekeurige variabelen te normaliseren om aan drie te voldoen momentcondities, aangezien lineaire transformatie $ X \ naar aX + b $ slechts twee toestaat. Maar aan de andere kant, waarom zouden we ons beperken tot lineaire transformaties? Zeker, verschuiving en schaal zijn verreweg het meest prominent (misschien omdat ze meestal voldoende, zeg maar voor limietstellingen), maar hoe zit het met hogere orde polynomen of het nemen van boomstammen, of met zichzelf bezig zijn?Is het eigenlijk niet waar Box-Cox-transformatie over gaat – scheeftrekken verwijderen?

Maar in het geval van meer gecompliceerde transformaties denk ik dat de context en de transformatie zelf belangrijk worden, dus misschien daarom zijn er geen “momenten met namen” meer. Dat betekent niet dat rvs niet getransformeerd worden en dat de momenten niet berekend worden, integendeel. Je kiest gewoon je transformatie, berekent wat je nodig hebt en gaat verder.

Het oude antwoord over waarom gecentraliseerde momenten vorm beter vertegenwoordigen dan onbewerkt:

Het trefwoord is vorm . Zoals Whuber suggereerde, willen we bij vorm rekening houden met de eigenschappen van de distributie die onveranderlijk zijn voor vertaling en schaling. Dat wil zeggen, als je de variabele $ X + c $ in plaats van $ X $ beschouwt, krijg je dezelfde distributiefunctie (alleen naar rechts of links verschoven), dus we zouden graag om te zeggen dat de vorm hetzelfde is gebleven.

De ruwe momenten veranderen wanneer je de variabele vertaalt, dus ze weerspiegelen niet alleen de vorm, maar ook een ook een locatie. In feite kun je elke willekeurige variabele nemen en die $ X \ naar X + c $ op de juiste manier verschuiven om een waarde te krijgen voor zijn, laten we zeggen, ruwe derde moment.

Dezelfde observatie geldt voor alle oneven momenten en in mindere mate voor even momenten (ze zijn van onderaf begrensd en de ondergrens hangt af van de vorm).

Het gecentraliseerde moment verandert daarentegen niet wanneer je de variabele vertaalt, zodat ” waarom ze de vorm beter beschrijven. Als uw even gecentraliseerde moment bijvoorbeeld groot is, weet u dat die willekeurige variabele een bepaalde massa heeft die niet te dicht bij de gemiddelde waarde ligt. Of als uw oneven moment nul is, weet u dat uw willekeurige variabele enige symmetrie rond gemiddelde.

Hetzelfde argument strekt zich uit tot schaal, die transformatie $ X \ naar cX $ is. De gebruikelijke normalisatie in dit geval is deling door standaarddeviatie, en de overeenkomstige momenten worden genormaliseerde momenten genoemd, in ieder geval door wikipedia .

Reacties

Kun je je uitleggen uw bewering over ” verplaats het om een waarde van het derde moment te krijgen “? Wat bedoel je precies met ” verplaats het, ” welke invloed heeft deze bewerking op de distributionele vorm , en waarom verandert het het derde moment?
Zeker: door rond te bewegen bedoelde ik vertalingen $ X \ naar X + c $. Het verandert duidelijk de waarde van het derde moment en je kunt ervoor zorgen dat deze gelijk is aan welke waarde dan ook. Het verandert de vorm van de verdeling niet door je mooie definitie van vorm hierboven.
Ah … je bedoelt het ruwe derde moment in plaats van het centrale derde moment. In deze context, waar we verschillende soorten momenten bespreken, ben ik het spoor vergeten welke je eigenlijk bedoelde. Die verkeerde lezing was zeker mijn schuld, maar als je dit bericht aanpast om te verduidelijken wat ” verplaats het betekent “, zou je kunnen overwegen om wat extra kleine aanpassingen om te voorkomen dat anderen in dezelfde val trappen.
(+1) Hartelijk dank dat je dit in een echt duidelijke, gezaghebbende post hebt veranderd.
Aaahh! Nu snap ik het. De vraag is: waarom normaliseren we niet ‘ door bijvoorbeeld te eisen dat het derde moment gelijk is aan nul en dat het tiende moment gelijk is aan één? OK, dat ‘ een heel andere vraag is, laat me erover nadenken 🙂

Reacties

Antwoord

Reacties

Geef een reactie Antwoord annuleren