Pour le deuxième et les moments supérieurs, les moments centraux (moments autour de la moyenne, avec c étant la moyenne) sont généralement utilisés plutôt que les moments autour de zéro, car ils fournissent des informations plus claires sur la forme de la distribution.
Quelquun pourrait-il mexpliquer / me convaincre pourquoi cest vrai? Pourquoi y a-t-il un écart?
Cela ma toujours dérangé et je nai jamais vu un bonne explication – je ne comprends tout simplement pas pourquoi / comment la normalisation fournit des informations « claires » dans un cas, mais pas dans un autre.
Par exemple:
- Pour calculer lasymétrie, pourquoi ne pas standardiser à la fois la moyenne et la variance?
- Pour calculer le kurtosis, pourquoi ne pas standardiser la moyenne, la variance, et lasymétrie?
- …
- Pour calculer le n ème moment, pourquoi ne pas dabord standardiser tous les m ème moments pour m < n?
Si standardisation est utile alors pourquoi ne faire cela que pour m = 1?
Commentaires
- Comment comprenez-vous » forme « ? Je suppose que cest la collection de toutes les propriétés dune distribution qui ne sont modifiées par aucun changement demplacement ou déchelle – en dautres termes, des propriétés qui persistent dans un graphique de la distribution lorsque tous les axes sont étiquetés sont effacés. Si vous partagez cette compréhension, alors (a) la réponse à votre question devrait devenir évidente et (b) il sera évident que les moments centraux ne sont pas le seul moyen de résoudre le problème de la description des formes; ils ne sont quun moyen détablir un emplacement et une échelle pour (la plupart) des distributions.
- Le mot » normalize » est lune des nombreuses sciences statistiques qui change le sens dun domaine à lautre, dans la mesure où il est dangereux. Lutiliser pour impliquer » moyenne soustraite » nest pas ‘ t standard pour beaucoup dentre nous . Jirais au-delà de mes connaissances en disant que ce nest pas standard pour tous, mais je vous mets au défi de citer la littérature où » normalize » est identique à » soustrayez la moyenne « .
- » Le deuxième type de normalisation provient des statistiques, et élimine lunité de mesure en transformant les données en nouveaux scores avec une moyenne de 0 et un écart type de 1 . » @NickCox Je pense que mon utilisation du mot nétait pas ‘ t trop bizarre et avait assez de sens pour faire passer le message, alors ne laissons pas ‘ aller sur une tangente ici.
- Désolé; que ‘ nest pas ce que jai demandé. Votre question était de savoir pourquoi utiliser des moments sur la moyenne plutôt que des moments sur zéro. Par exemple, le deuxième moment concernant la moyenne est la variance; il ‘ nest pas mis à léchelle par lécart type. Naturellement, je conviens que lasymétrie et laplatissement sont souvent définis comme des rapports de moment, ce qui équivaut à une mise à léchelle par lécart-type également, mais aucun nest mentionné dans votre question. Bref, mon commentaire porte sur le libellé de votre question. Vous ‘ avez fourni des preuves à lappui de mon affirmation, car soustraire la moyenne et diviser par écart-type sappelle communément la normalisation.
- Je nai pas ‘ t dire que je me sentais confus; malheureusement, je reste d’avis que l’importance précise de votre question ne sera probablement pas claire pour d’autres. Un article avec une saveur de tutoriel à stata-journal.com/sjpdf.html?articlenum=st0204 peut intéresser les personnes curieuses de connaître des moments.
Réponse
Depuis que la question a été mise à jour, je mets à jour ma réponse:
La première partie (Pour calculer le asymétrie, pourquoi ne pas standardiser à la fois la moyenne et la variance?) est facile: cest précisément ainsi que cela se fait! Voir les définitions de skewness et kurtosis dans le wiki.
La deuxième partie est à la fois facile et difficile. Dune part, nous pourrions dire quil est impossible de normaliser une variable aléatoire pour en satisfaire trois conditions de moment, car la transformation linéaire $ X \ en aX + b $ ne permet que deux. Mais dun autre côté, pourquoi devrions-nous nous limiter aux transformations linéaires? Bien sûr, le décalage et léchelle sont de loin les plus importants (peut-être parce quils sont suffisant la plupart du temps, par exemple pour les théorèmes limites), mais quen est-il des polynômes dordre supérieur ou prendre des journaux, ou convolver avec lui-même?En fait, n « est-ce pas ce qu » il est question de la transformation de Box-Cox – supprimer le biais?
Mais dans le cas de transformations plus compliquées, je pense que le contexte et la transformation elle-même deviennent importants, alors peut-être cest pourquoi il ny a plus de « moments avec des noms ». Cela ne veut pas dire que les RV ne sont pas transformés et que les moments ne sont pas calculés, au contraire. Vous venez de choisir votre transformation, calculez ce dont vous avez besoin et passez à autre chose.
La vieille réponse sur les raisons pour lesquelles les moments centralisés représentent mieux la forme que la forme brute:
Le mot-clé est forme . Comme Whuber la suggéré, par forme, nous voulons considérer le propriétés de la distribution qui sont invariantes à la translation et à la mise à léchelle. Autrement dit, lorsque vous considérez la variable $ X + c $ au lieu de $ X $, vous obtenez la même fonction de distribution (juste décalée vers la droite ou la gauche), donc nous aimerions pour dire que sa forme est restée la même.
Les moments bruts changent lorsque vous traduisez la variable, donc ils reflètent non seulement la forme, mais un Aussi un emplacement. En fait, vous pouvez prendre nimporte quelle variable aléatoire et la décaler de manière appropriée $ X \ à X + c $ pour obtenir nimporte quelle valeur pour son troisième moment brut, par exemple.
La même observation vaut pour tous les moments impairs. et dans une moindre mesure pour des moments pairs (ils sont délimités par le bas et la limite inférieure dépend de la forme).
Le moment centralisé, en revanche, ne change pas lorsque vous traduisez la variable, de sorte que » s pourquoi ils sont plus descriptifs de la forme. Par exemple, si votre moment même centralisé est grand, vous savez que la variable aléatoire a une masse pas trop proche de la moyenne. Ou si votre moment impair est nul, vous savez que votre variable aléatoire a une certaine symétrie autour de la moyenne.
Le même argument sétend à léchelle, qui est la transformation $ X \ en cX $. La normalisation habituelle dans ce cas est la division par écart-type, et les moments correspondants sont appelés moments normalisés, au moins par wikipedia .
Commentaires
- Pourriez-vous nous expliquer votre assertion concernant » déplacez-la pour obtenir une valeur du troisième moment « ? Quentendez-vous exactement par » déplacez-le, » quel rapport cette opération a-t-elle sur la forme distributionnelle , et pourquoi cela change-t-il le troisième moment?
- Bien sûr: en me déplaçant, je voulais dire des traductions $ X \ en X + c $. Cela change évidemment la valeur du troisième moment et vous pouvez lobtenir égale à nimporte quelle valeur. Cela ne change pas la forme de la distribution par votre belle définition de forme ci-dessus.
- Ah … vous voulez dire le troisième moment brut plutôt que le troisième moment central. Dans ce contexte, où nous discutons de plusieurs types de moments, jai perdu la trace de celui que vous vouliez réellement dire. Cette erreur de lecture était sûrement de ma faute, mais lorsque vous modifiez ce message pour clarifier ce que » déplacer signifie « , vous pourriez envisager den ajouter des modifications mineures pour éviter que dautres ne tombent dans le même piège.
- (+1) Merci beaucoup davoir transformé ce message en un article très clair et faisant autorité.
- Aaahh! Maintenant je comprends. La question est: pourquoi ne ‘ t-on normaliser en exigeant, disons, que le troisième moment soit égal à zéro, et que le dixième soit égal à un? OK, cette ‘ est une question complètement différente, laissez-moi y réfléchir 🙂