Pro druhé a vyšší momenty se obvykle používají spíše centrální momenty (momenty o střední hodnotě, přičemž c je průměr), spíše než momenty o nule, protože poskytují jasnější informace o tvaru distribuce.
Mohl by mi někdo vysvětlit / přesvědčit, proč je to pravda? Proč existuje nesrovnalost?
To mě vždy otravovalo a nikdy jsem neviděl dobré vysvětlení – prostě nerozumím, proč / jak standardizace poskytuje „jasné“ informace v jednom případě, ale ne v jiném.
Například:
- Chcete-li vypočítat šikmost, proč nestandardizovat oba průměr a rozptyl?
- Chcete-li vypočítat špičatost, proč nestandardizovat průměr, rozptyl, a šikmost?
- …
- vypočítat n ten moment, proč nejdříve standardizovat všechny m th momenty pro m < n?
Pokud standardizace je užitečné, tak proč to dělat pouze pro m = 1?
Komentáře
- Jak rozumíte “ tvar „? Beru to jako kolekci všech vlastností distribuce, které se nezmění žádnou změnou umístění nebo měřítka – jinými slovy, vlastnosti, které přetrvávají v grafu distribuce, když jsou všechny popisky os jsou vymazány. Pokud sdílíte toto porozumění, pak by (a) měla být zřejmá odpověď na vaši otázku ab) bude zřejmé, že ústřední momenty nejsou jediným způsobem, jak vyřešit problém popisu tvarů; jsou pouze jedním ze způsobů, jak určit umístění a měřítko pro (většinu) distribucí.
- Slovo “ normalizovat “ je jedním z mnoha statistických věd, které mění význam z pole na pole do té míry, že je to nebezpečné. Jeho použití k označení “ průměrného odečtení “ není pro mnoho z nás standard ‚ t . Rád bych překročil své znalosti, kdybych řekl, že je to nestandardní pro všechny, ale vyzývám vás, abyste citovali literaturu, kde “ normalizovat “ je identické s “ odečíst průměr „.
- “ Druhý typ normalizace pochází ze statistik a eliminuje měrnou jednotku transformací dat na nová skóre se střední hodnotou 0 a standardní odchylka 1 . “ @NickCox Myslím, že moje použití slova nebylo ‚ Nebylo to příliš bizarní a mělo to dostatečný smysl, abychom to pochopili, takže ‚ to zde nepokračujme.
- Omlouvám se; to ‚ není to, na co jsem se ptal. Vaše otázka byla, proč používat momenty o průměru spíše než momenty o nule. Například druhým okamžikem střední hodnoty je rozptyl; není ‚ změněna standardní odchylkou. Přirozeně souhlasím s tím, že šikmost a špičatost jsou často definovány jako momentové poměry, což je ekvivalentní také se škálováním směrodatnou odchylkou, ale ve vaší otázce se to vůbec nezmíní. Stručně řečeno, můj komentář se týká znění vaší otázky. ‚ jste poskytli důkazy o svém tvrzení, protože odečtení průměru a dělení pomocí SD se běžně nazývá standardizace.
- Neudělal jsem ‚ neříkám, že jsem se cítil zmatený; bohužel nadále zastávám názor, že přesný import vaší otázky bude ostatním nejasný. Příspěvek s výukovou příchutí na stata-journal.com/sjpdf.html?articlenum=st0204 může mít zájem o lidi zvědavé na okamžiky.
Odpověď
Jelikož byla otázka aktualizována, aktualizuji svoji odpověď:
První část (Pro výpočet skewness, proč ne standardizovat průměr i rozptyl?) je snadné: přesně tak je to hotovo! Viz definice skewness a kurtosis ve wiki.
Druhá část je jak snadná, tak tvrdá. Na jedné straně bychom mohli říci, že je nemožné normalizovat náhodnou proměnnou tak, aby splňovala tři momentové podmínky, protože lineární transformace $ X \ na aX + b $ umožňuje pouze dvě. Ale na druhou stranu, proč bychom se měli omezit na lineární transformace? Jistě, posun a měřítko jsou zdaleka nejvýznamnější (možná proto, že jsou většinu času dostačující, řekněme pro limitní věty), ale co polynomy vyššího řádu nebo pořizovat protokoly nebo se svolávat sám se sebou?Ve skutečnosti nejde o to, o čem je transformace Box-Cox – odstranění zkosení?
Ale v případě složitějších transformací se domnívám, že kontext a samotná transformace se stanou důležitými, takže možná to je důvod, proč již neexistují žádné „momenty se jmény“. To neznamená, že rvs nejsou transformovány a že momenty nejsou počítány, naopak. Stačí si vybrat svoji transformaci, spočítat, co potřebujete, a jít dál.
Stará odpověď o tom, proč centralizované momenty představují tvar lépe než syrový:
Klíčové slovo je tvar . Jak navrhl whuber, podle tvaru chceme uvažovat vlastnosti distribuce, které jsou neměnné pro překlad a změnu měřítka. To znamená, že když vezmete v úvahu proměnnou $ X + c $ místo $ X $, získáte stejnou distribuční funkci (posunutou doprava nebo doleva), takže bychom chtěli říci, že jeho tvar zůstal stejný.
Nezpracované momenty se při překladu proměnné změní, takže odrážejí nejen tvar, ale i Také místo. Ve skutečnosti můžete vzít libovolnou náhodnou proměnnou a vhodně ji přesunout $ X \ na X + c $, abyste získali jakoukoli hodnotu pro její, řekněme, surový třetí okamžik.
Stejné pozorování platí pro všechny liché momenty a v menší míře pro sudé momenty (jsou omezeny zdola a dolní mez závisí na tvaru).
Na druhou stranu centralizovaný moment se při překladu proměnné nezmění, takže „ proto jsou více popisné pro tvar. Například pokud je váš sudý centralizovaný moment velký, víte, že náhodná proměnná má nějakou hmotu, která není příliš blízko na to, aby znamenala. Nebo pokud je váš lichý okamžik nula, víte, že vaše náhodná proměnná má nějaká symetrie kolem průměru.
Stejný argument se vztahuje i na scale, což je transformace $ X \ na cX $. Obvyklou normalizací je v tomto případě dělení směrodatnou odchylkou a odpovídajícím momentům se říká normalizované momenty, alespoň prostřednictvím wikipedia .
Komentáře
- Mohl byste mi vysvětlit ur tvrzení o “ přesunout jej a získat jakoukoli hodnotu třetího okamžiku „? Co přesně myslíte pod pojmem “ přesunout jej, “ jaký vliv má tato operace na distribuční tvar , a proč mění třetí okamžik?
- Jistě: pohybem jsem myslel překlady $ X \ do X + c $. Zjevně to změní hodnotu třetího okamžiku a můžete získat, aby se rovnal jakékoli hodnotě. Nezmění to tvar distribuce podle vaší pěkné definice tvaru výše.
- Ah … máte na mysli surový třetí okamžik, spíše než centrální třetí okamžik. V této souvislosti, kde diskutujeme o několika druzích momentů, jsem ztratil přehled o tom, který z nich jste vlastně mysleli. Toto nesprávné čtení bylo jistě mojí chybou, ale když upravíte tento příspěvek, abyste objasnili, co “ přesunout to znamená “ můžete zvážit vytvoření dalších drobné úpravy, které mají zabránit tomu, aby ostatní padli do stejné pasti.
- (+1) Mnohokrát děkujeme za to, že se z toho stal skutečně jasný a autoritativní příspěvek.
- Aaahh! Teď to chápu. Otázka zní: proč se ‚ t normalizujeme tím, že požadujeme, řekněme, že třetí okamžik byl roven nule a ten desátý byl roven jedné? Dobře, ‚ je úplně jiná otázka, nech mě o tom přemýšlet 🙂