Perché il primo momento è standardizzato prima di calcolare i momenti più alti, ma i momenti più alti non lo sono?

Wikipedia dice :

Per il secondo e per i momenti superiori, i momenti centrali (momenti sulla media, dove c è la media) sono solitamente usati piuttosto che i momenti intorno allo zero, perché forniscono informazioni più chiare sulla forma della distribuzione.

Qualcuno potrebbe spiegarmi / convincermi perché questo è vero? Perché cè una discrepanza?
Questo mi ha sempre infastidito e non ho mai visto un buona spiegazione – Non capisco bene perché / come la standardizzazione fornisce informazioni “chiare” in un caso, ma non in un altro.

Ad esempio:

Per calcolare lasimmetria, perché non standardizzare entrambi la media e la varianza?
Per calcolare la curtosi, perché non standardizzare la media, la varianza, e lasimmetria?
…
Per calcolare ln ^esimo momento, perché non standardizzare prima tutti gli m ^esimi momenti per m < n?
Se la standardizzazione è utile allora perché farlo solo per m = 1?

Commenti

Come intendi ” forma “? Immagino che sia la raccolta di tutte le proprietà di una distribuzione che non sono alterate da alcun cambiamento di posizione o scala – in altre parole, proprietà che persistono in un grafico della distribuzione quando tutte le etichette degli assi vengono cancellati. Se condividi questa comprensione allora (a) la risposta alla tua domanda dovrebbe diventare ovvia e (b) sarà evidente che i momenti centrali non sono lunico modo per risolvere il problema della descrizione delle forme; sono semplicemente un modo per stabilire una posizione e una scala per la (maggior parte) distribuzioni.
La parola ” normalize ” è uno dei tanti nella scienza statistica che cambia significato da campo a campo, nella misura in cui è pericoloso. Usandolo per indicare ” ” ‘ standard sottratto per molti di noi . Sarei al di là delle mie conoscenze affermando che non è standard per tutti, ma ti sfido a citare la letteratura in cui ” normalize ” è identico a ” sottrai la media “.
” Il secondo tipo di normalizzazione deriva dalle statistiche ed elimina lunità di misura trasformando i dati in nuovi punteggi con una media di 0 e una deviazione standard di 1 . ” @NickCox Penso che il mio utilizzo della parola non fosse ‘ t troppo stravagante e aveva abbastanza senso per far capire il punto, quindi lascia che ‘ non prenda una tangente qui.
Spiacente; questo ‘ non è quello che ho chiesto. La tua domanda era: perché utilizzare momenti sulla media piuttosto che momenti sullo zero. Ad esempio, il secondo momento sulla media è la varianza; ‘ non viene ridimensionato in base alla deviazione standard. Naturalmente sono daccordo sul fatto che lasimmetria e la curtosi siano spesso definite come rapporti dei momenti, che equivale anche al ridimensionamento in base alla deviazione standard, ma nessuno dei due è affatto menzionato nella tua domanda. In breve, il mio commento riguarda la formulazione della tua domanda. ‘ hai fornito prove per la mia affermazione, poiché la sottrazione della media e la divisione per SD sono comunemente chiamate standardizzazione.
Io non ‘ t dire che mi sono sentito confuso; purtroppo resto dellidea che la portata precisa della sua domanda rischia di non essere chiara agli altri. Un documento con il sapore di un tutorial su stata-journal.com/sjpdf.html?articlenum=st0204 potrebbe interessare le persone curiose dei momenti.

Risposta

Poiché la domanda è stata aggiornata, aggiorno la mia risposta:

La prima parte (per calcolare il asimmetria, perché non standardizzare sia la media che la varianza?) è facile: è proprio così che si fa! Consulta le definizioni di asimmetria e curtosi in wiki.

La seconda parte è sia facile che difficile. Da un lato potremmo dire che è impossibile normalizzare la variabile casuale per soddisfarne tre condizioni di momento, poiché la trasformazione lineare $ X \ in aX + b $ ne consente solo due. Ma daltra parte, perché dovremmo limitarci alle trasformazioni lineari? Certo, lo spostamento e la scala sono di gran lunga i più importanti (forse perché sono sufficiente per la maggior parte del tempo, diciamo per i teoremi limite), ma per quanto riguarda i polinomi di ordine superiore o prendendo i registri, o convolgere con se stesso?In effetti, non è questo il significato della trasformazione di Box-Cox: rimuovere linclinazione?

Ma nel caso di trasformazioni più complicate, penso, il contesto e la trasformazione stessa diventano importanti, quindi forse ecco perché non ci sono più “momenti con nomi”. Ciò non significa che i rv non siano trasformati e che i momenti non siano calcolati, al contrario. Devi solo scegliere la tua trasformazione, calcolare ciò di cui hai bisogno e andare avanti.

La vecchia risposta sul perché i momenti centralizzati rappresentano la forma meglio di quella grezza:

La parola chiave è forma . Come suggerito da whuber, per forma vogliamo considerare proprietà della distribuzione invarianti alla traslazione e al ridimensionamento. Cioè, se si considera la variabile $ X + c $ invece di $ X $, si ottiene la stessa funzione di distribuzione (solo spostata a destra oa sinistra), quindi vorremmo per dire che la sua forma è rimasta la stessa.

I momenti grezzi cambiano quando traduci la variabile, quindi riflettono non solo la forma, ma un Anche un luogo. In effetti, puoi prendere qualsiasi variabile casuale e spostarla da $ X \ a X + c $ in modo appropriato per ottenere qualsiasi valore per il suo terzo momento, diciamo, grezzo.

La stessa osservazione vale per tutti i momenti dispari e in misura minore per i momenti pari (sono delimitati dal basso e il limite inferiore dipende dalla forma).

Il momento centralizzato, daltra parte, non cambia quando si traduce la variabile, in modo che ” s perché sono più descrittivi della forma. Ad esempio, se il tuo momento anche centralizzato è grande, sai che la variabile casuale ha una massa non troppo vicina alla media. Oppure se il tuo momento dispari è zero, sai che la tua variabile casuale ha una certa simmetria intorno alla media.

Lo stesso argomento si estende alla scala, che è la trasformazione $ X \ in cX $. La normale normalizzazione in questo caso è la divisione per deviazione standard, ei momenti corrispondenti sono chiamati momenti normalizzati, almeno da wikipedia .

Commenti

Potresti spiegare La tua affermazione su ” spostala per ottenere un valore qualsiasi del terzo momento “? Che cosa intendi esattamente con ” spostalo, ” che rapporto ha questa operazione sulla forma distributiva , e perché cambia il terzo momento?
Certo: spostandomi intendevo traduzioni $ X \ in X + c $. Ovviamente cambia il valore del terzo momento e puoi farlo essere uguale a qualsiasi valore. Non cambia la forma della distribuzione con la tua bella definizione di forma sopra.
Ah … intendi il terzo momento grezzo piuttosto che il terzo momento centrale. In questo contesto, in cui stiamo discutendo di diversi tipi di momenti, ho perso il conto di quello che intendevi veramente. Quella lettura errata è stata sicuramente colpa mia, ma quando modifichi questo post per chiarire cosa ” spostarlo significa ” potresti prendere in considerazione di aggiungerne modifiche minori per evitare che altri cadano nella stessa trappola.
(+1) Molte grazie per aver trasformato questo in un post davvero chiaro e autorevole.
Aaahh! Ora capisco. La domanda è: perché non ‘ normalizziamo richiedendo, diciamo, che il terzo momento fosse uguale a zero e che il decimo fosse uguale a uno? OK, quella ‘ è una domanda completamente diversa, fammi pensare 🙂

Commenti

Risposta

Commenti

Lascia un commento Annulla risposta