Mówi Wikipedia :

W przypadku drugiego i wyższych momentów, zazwyczaj używane są momenty centralne (momenty dotyczące średniej, gdzie c jest średnią) zamiast momentów około zera, ponieważ dostarczają one wyraźniejszych informacji o kształcie rozkładu.

Czy ktoś mógłby mi wyjaśnić / przekonać, dlaczego to prawda? Dlaczego istnieje rozbieżność?
Zawsze mnie to niepokoiło i nigdy nie widziałem dobre wyjaśnienie – po prostu nie bardzo rozumiem, dlaczego / w jaki sposób standaryzacja zapewnia „jasne” informacje w jednym przypadku, ale nie w innym.

Na przykład:

  1. Aby obliczyć skośność, dlaczego nie ustandaryzować zarówno średnią i wariancja?
  2. Aby obliczyć kurtoozę, dlaczego nie ustandaryzować średnią, wariancję, i skośność?
  3. Aby obliczyć n th moment, dlaczego nie ujednolicić najpierw wszystkich m th momentów dla m < n?
    Jeśli standaryzacja jest przydatne, więc dlaczego robisz to tylko dla m = 1?

Komentarze

  • Jak rozumiesz ” kształt „? Przyjmuję, że jest to zbiór wszystkich właściwości rozkładu, które nie są zmieniane przez żadną zmianę lokalizacji lub skali – innymi słowy, właściwości, które pozostają na wykresie rozkładu, gdy wszystkie etykiety osi są usuwane. Jeśli podzielasz to rozumienie, (a) odpowiedź na twoje pytanie powinna stać się oczywista i (b) okaże się, że kluczowe momenty nie są jedynym sposobem rozwiązania problemu opisywania kształtów; są tylko jednym ze sposobów ustalenia lokalizacji i skali (większości) dystrybucji.
  • Słowo ” normalizuje ” jest jedną z wielu w naukach statystycznych, która zmienia znaczenie z pola na dziedzinę, do tego stopnia, że jest niebezpieczna. Używanie go do sugerowania, że ” odejmowane od średniej ” nie jest ' t standardem dla wielu z nas . Przekroczyłbym swoją wiedzę, mówiąc, że jest to niestandardowe dla wszystkich, ale wzywam Cię do zacytowania literatury, w której ” normalizuje ” jest taki sam jak ” odejmij średnią „.
  • ” Drugi typ normalizacji wywodzi się ze statystyk i eliminuje jednostkę miary poprzez przekształcanie danych w nowe wyniki ze średnią 0 i odchylenie standardowe 1 . ” @NickCox Myślę, że moje użycie tego słowa nie było ' nie jest zbyt dziwaczne i ma na tyle sensu, aby przedstawić punkt widzenia, więc pozwól ' nie iść tutaj na styczną.
  • Przepraszamy; że ' nie jest tym, o co prosiłem. Twoje pytanie brzmiało: dlaczego używaj chwil o średniej, a nie o zerowej. Na przykład, drugi moment dotyczący średniej to wariancja; to ' nie jest skalowane przez odchylenie standardowe. Oczywiście zgadzam się, że skośność i kurtozy są często definiowane jako współczynniki momentów, co jest równoznaczne ze skalowaniem również przez odchylenie standardowe, ale żadne z nich nie zostało w ogóle wymienione w twoim pytaniu. Krótko mówiąc, mój komentarz dotyczy sformułowania twojego pytania. Dostarczyłeś ' dowody na moje twierdzenie, ponieważ odejmowanie średniej i dzielenie przez SD jest powszechnie nazywane standaryzacją.
  • Nie ' t powiedzieć, że czułem się zdezorientowany; niestety nadal uważam, że dokładna treść pańskiego pytania może być dla innych niejasna. Artykuł zawierający samouczek pod adresem stata-journal.com/sjpdf.html?articlenum=st0204 może zainteresować osoby ciekawi chwil.

Odpowiedź

Ponieważ pytanie zostało zaktualizowane, aktualizuję odpowiedź:

Pierwsza część (Aby obliczyć skośność, dlaczego nie ustandaryzować zarówno średnią, jak i wariancję?) jest łatwe: Dokładnie tak to się robi! Zobacz definicje skośności i kurtosis na wiki.

Druga część jest zarówno łatwa, jak i trudna. Z jednej strony można powiedzieć, że nie można znormalizować zmiennej losowej, aby spełnić trzy warunki momentowe, ponieważ transformacja liniowa $ X \ do aX + b $ pozwala tylko na dwa. Ale z drugiej strony, dlaczego mielibyśmy ograniczać się do przekształceń liniowych? Oczywiście, przesunięcie i skala są zdecydowanie najbardziej widoczne (może dlatego, że są wystarczające przez większość czasu, powiedzmy dla twierdzeń granicznych), ale co z wielomianami wyższego rzędu lub robienie dzienników lub konwój z samym sobą?W rzeczywistości, czy nie o to chodzi w transformacji Boxa-Coxa – usuwaniu skosu?

Ale w przypadku bardziej skomplikowanych transformacji, myślę, że kontekst i sama transformacja stają się ważne, więc może dlatego nie ma już „momentów z imionami”. Nie oznacza to, że rv nie są przekształcane, a momenty nie są obliczane, wręcz przeciwnie. Po prostu wybierasz swoją transformację, obliczasz, czego potrzebujesz i idziesz dalej.


Stara odpowiedź na pytanie, dlaczego scentralizowane momenty lepiej przedstawiają kształt niż surowy:

Słowem kluczowym jest kształt . właściwości dystrybucji, które są niezmienne względem tłumaczenia i skalowania. Oznacza to, że biorąc pod uwagę zmienną $ X + c $ zamiast $ X $, otrzymujemy tę samą funkcję dystrybucji (po prostu przesuniętą w prawo lub w lewo), więc chcielibyśmy powiedzieć, że jej kształt pozostał taki sam.

Surowe momenty zmieniają się, kiedy tłumaczysz zmienną, więc odzwierciedlają nie tylko kształt, ale Również lokalizacja. W rzeczywistości możesz wziąć dowolną zmienną losową i odpowiednio ją przesunąć $ X \ do X + c $, aby uzyskać dowolną wartość jej, powiedzmy, surowej trzeciej chwili.

Ta sama obserwacja dotyczy wszystkich nieparzystych momentów i w mniejszym stopniu dla momentów parzystych (są one ograniczone od dołu, a dolna granica zależy od kształtu).

Z drugiej strony, scentralizowany moment nie zmienia się podczas tłumaczenia zmiennej, więc „ dlatego są one bardziej opisowe dla kształtu. Na przykład, jeśli Twój nawet scentralizowany moment jest duży, wiesz, że zmienna losowa ma masę niezbyt bliską średniej. Lub jeśli Twój nieparzysty moment wynosi zero, wiesz, że zmienna losowa ma pewna symetria wokół średniej.

Ten sam argument rozciąga się na skalę, czyli transformację $ X \ do cX $. Zwykłą normalizacją w tym przypadku jest dzielenie przez odchylenie standardowe, a odpowiednie momenty nazywane są momentami znormalizowanymi, przynajmniej przez wikipedię .

Komentarze

  • Czy mógłbyś wyjaśnić Twoje potwierdzenie dotyczące ” przesuń go, aby uzyskać dowolną wartość trzeciego momentu „? Co dokładnie masz na myśli, mówiąc ” przesuń go dookoła, ” jaki kierunek ma ta operacja na kształcie dystrybucyjnym i dlaczego zmienia trzeci moment?
  • Jasne: poruszając się po okolicy miałem na myśli tłumaczenia $ X \ na X + c $. To oczywiście zmienia wartość trzeciego momentu i możesz sprawić, że będzie równa dowolnej wartości. Nie zmienia to kształtu rozkładu według twojej ładnej definicji kształtu powyżej.
  • Ach … masz na myśli raczej surowy trzeci moment niż środkowy trzeci moment. W tym kontekście, kiedy omawiamy kilka rodzajów momentów, straciłem z oczu, który z nich masz na myśli. To błędne odczytanie było z pewnością moją winą, ale kiedy zmodyfikujesz ten post, aby wyjaśnić, co ” przesuwaj go wokół oznacza „, możesz rozważyć dodanie dodatkowych drobne zmiany, które pomogą zapobiec wpadnięciu innych w tę samą pułapkę.
  • (+1) Wielkie dzięki za przekształcenie tego w naprawdę przejrzysty, autorytatywny post.
  • Aaaach! Teraz rozumiem. Pytanie brzmi: dlaczego nie ' nie normalizujemy, wymagając, powiedzmy, że trzeci moment był równy zero, a dziesiąty był równy jeden? OK, to ' to zupełnie inne pytanie, pozwól, że pomyślę o tym 🙂

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *