Warum wird der erste Moment standardisiert, bevor höhere Momente berechnet werden, höhere Momente jedoch nicht?

Wikipedia sagt :

Für das zweite und höhere Moment werden normalerweise die zentralen Momente (Momente um den Mittelwert, wobei c der Mittelwert ist) anstelle der Momente um Null verwendet, da sie klarere Informationen über die Form der Verteilung liefern.

Könnte mir jemand erklären / überzeugen, warum dies wahr ist? Warum gibt es eine Diskrepanz?
Das hat mich immer nervt und ich habe noch nie einen gesehen gute Erklärung dafür – ich verstehe nur nicht ganz, warum / wie die Standardisierung in einem Fall „klare“ Informationen liefert, aber nicht in einem anderen.

Zum Beispiel:

Um die Schiefe zu berechnen, sollten Sie sowohl den Mittelwert als auch standardisieren die Varianz?
Um die Kurtosis zu berechnen, warum nicht den Mittelwert, die Varianz, und die Schiefe standardisieren?
…
To Berechnen Sie den n-ten -Moment. Warum standardisieren Sie nicht zuerst alle m-ten -Momente für m < n?
Wenn Standardisierung ist dann nützlich, warum dies nur für m = 1 tun?

Kommentare

Wie verstehen Sie “ Form „? Ich nehme an, dass es sich um die Sammlung aller Eigenschaften einer Verteilung handelt, die durch keine Änderung der Position oder des Maßstabs geändert werden – mit anderen Worten, Eigenschaften, die in einem Diagramm der Verteilung bestehen bleiben, wenn alle Achsen beschriftet sind gelöscht werden. Wenn Sie dieses Verständnis teilen, sollte (a) die Antwort auf Ihre Frage offensichtlich werden und (b) es wird offensichtlich sein, dass zentrale Momente nicht der einzige Weg sind, das Problem der Beschreibung von Formen zu lösen; Sie sind nur eine Möglichkeit, einen Ort und eine Skala für (die meisten) Verteilungen festzulegen.
Das Wort “ normalisiert “ ist eine von vielen in der Statistikwissenschaft, die ihre Bedeutung von Feld zu Feld ändert, soweit dies gefährlich ist. Wenn Sie damit “ bedeuten, subtrahiert „, ist dies für viele von uns kein ‚ t-Standard . Ich würde mein Wissen übertreffen, um zu sagen, dass es nicht für alle Standard ist, aber ich fordere Sie auf, Literatur zu zitieren, in der “ “ normalisiert ist identisch mit “ subtrahiert den Mittelwert „.
“ Die zweite Art der Normalisierung stammt aus Statistiken und eliminiert die Maßeinheit, indem die Daten in neue Scores mit einem Mittelwert umgewandelt werden von 0 und eine Standardabweichung von 1 . “ @NickCox Ich denke, meine Verwendung des Wortes war nicht ‚ nicht zu ausgefallen und sinnvoll genug, um den Punkt zu vermitteln, also lassen Sie ‚ hier keine Tangente spielen.
Entschuldigung; das ‚ ist nicht das, was ich gefragt habe. Ihre Frage war, warum Sie Momente um den Mittelwert anstelle von Momenten um Null verwenden sollten. Zum Beispiel ist der zweite Moment um den Mittelwert die Varianz; ‚ wird nicht mit der Standardabweichung skaliert. Natürlich stimme ich zu, dass Schiefe und Kurtosis oft als Momentverhältnisse definiert werden, was auch einer Skalierung um die Standardabweichung entspricht, aber in Ihrer Frage wird keines von beiden erwähnt. Kurz gesagt, mein Kommentar bezieht sich auf den Wortlaut Ihrer Frage. Sie ‚ haben Beweise für meine Behauptung geliefert, da das Subtrahieren des Mittelwerts und das Teilen durch SD üblicherweise als Standardisierung bezeichnet wird.
Ich habe nicht ‚ stata-journal.com/sjpdf.html?articlenum=st0204 könnte für Leute interessant sein, die neugierig auf Momente sind.

Antwort

Da die Frage aktualisiert wurde, aktualisiere ich meine Antwort:

Der erste Teil (Um die zu berechnen Schiefe, warum nicht sowohl den Mittelwert als auch die Varianz standardisieren?) ist einfach: Genau so wird es gemacht! Siehe die Definitionen von Schiefe und Kurtosis im Wiki.

Der zweite Teil ist sowohl einfach als auch schwierig. Einerseits können wir sagen, dass es unmöglich ist, Zufallsvariablen zu normalisieren, um drei zu erfüllen Momentbedingungen, da die lineare Transformation $ X \ zu aX + b $ nur zwei zulässt. Aber warum sollten wir uns andererseits auf lineare Transformationen beschränken? Sicher, Verschiebung und Skalierung sind bei weitem die wichtigsten (vielleicht weil sie es sind) die meiste Zeit ausreichend, etwa für Grenzwertsätze), aber was ist mit Polynomen höherer Ordnung? oder Protokolle nehmen oder sich mit sich selbst falten?Ist es nicht das, worum es bei der Box-Cox-Transformation geht – das Entfernen von Versatz?

Aber bei komplizierteren Transformationen, denke ich, werden der Kontext und die Transformation selbst wichtig, also vielleicht Deshalb gibt es keine „Momente mit Namen“ mehr. Das bedeutet nicht, dass RVs nicht transformiert werden und dass die Momente im Gegenteil nicht berechnet werden. Sie haben einfach Ihre Transformation ausgewählt, berechnet, was Sie brauchen, und fahren fort.

Die alte Antwort darauf, warum zentralisierte Momente Form besser darstellen als roh:

Das Schlüsselwort lautet Form . Wie bereits erwähnt, möchten wir nach Form die Eigenschaften der Verteilung, die für die Übersetzung und Skalierung unveränderlich sind. Wenn Sie also die Variable $ X + c $ anstelle von $ X $ betrachten, erhalten Sie dieselbe Verteilungsfunktion (nur nach rechts oder links verschoben), also möchten wir um zu sagen, dass seine Form gleich geblieben ist.

Die rohen Momente ändern sich, wenn Sie die Variable übersetzen, sodass sie nicht nur die Form, sondern auch a widerspiegeln lso ein Ort. Tatsächlich können Sie jede Zufallsvariable nehmen und sie $ X \ entsprechend nach X + c $ verschieben, um einen beliebigen Wert für den beispielsweise rohen dritten Moment zu erhalten.

Die gleiche Beobachtung gilt für alle ungeraden Momente und in geringerem Maße für gerade Momente (sie sind von unten begrenzt und die Untergrenze hängt von der Form ab).

Das zentralisierte Moment ändert sich dagegen nicht, wenn Sie die Variable übersetzen, so dass “ s warum sie die Form besser beschreiben. Wenn beispielsweise Ihr gerades zentrales Moment groß ist, wissen Sie, dass die Zufallsvariable eine Masse hat, die nicht zu nahe am Mittelwert liegt. Oder wenn Ihr ungerades Moment Null ist, wissen Sie, dass Ihre Zufallsvariable hat Eine gewisse Symmetrie um den Mittelwert.

Das gleiche Argument gilt auch für die Skalierung, bei der es sich um die Transformation von $ X \ zu cX $ handelt. Die übliche Normalisierung ist in diesem Fall die Division durch Standardabweichung, und die entsprechenden Momente werden als normalisierte Momente bezeichnet. Zumindest von wikipedia .

Kommentare

Können Sie uns das erklären? Ihre Behauptung über “ verschiebt sie, um einen Wert für den dritten Moment zu erhalten „? Was genau meinst du mit “ bewege es, “ welche Bedeutung hat diese Operation für die verteilte Form und warum ändert es den dritten Moment?
Sicher: Mit Bewegen meinte ich Übersetzungen $ X \ nach X + c $. Es ändert offensichtlich den Wert des dritten Moments und Sie können erreichen, dass er gleich dem Wert ist. Es ändert nichts an der Form der Verteilung durch Ihre obige nette Definition der Form.
Ah … Sie meinen eher den rohen dritten Moment als den zentralen dritten Moment. In diesem Zusammenhang, in dem wir verschiedene Arten von Momenten diskutieren, habe ich den Überblick verloren, welchen Sie tatsächlich gemeint haben. Diese Fehlinterpretation war sicherlich meine Schuld, aber wenn Sie diesen Beitrag ändern, um zu verdeutlichen, was “ bedeutet, dass “ Sie möglicherweise zusätzliche Änderungen vornehmen kleinere Änderungen, um zu verhindern, dass andere in dieselbe Falle tappen.
(+1) Vielen Dank, dass Sie daraus einen wirklich klaren, maßgeblichen Beitrag gemacht haben.
Aaahh! Jetzt habe ich es verstanden. Die Frage ist: Warum normalisieren wir nicht ‚, indem wir beispielsweise verlangen, dass der dritte Moment gleich Null ist und dass der zehnte gleich eins ist? OK, das ‚ ist eine ganz andere Frage, lassen Sie mich darüber nachdenken 🙂

Kommentare

Antwort

Kommentare

Schreibe einen Kommentar Antworten abbrechen