Studiuję jednowymiarowe i dyskretne szeregi czasowe. Wiem, że reszty powinny być efektywnie losowe i dobrze dopasowane oraz powinny mieć kształt dzwonu.
Czy poniższy wykres sugeruje, że reszty są efektywnie losowo?
Komentarze
- Witamy na stronie @Marco. Nie mam pojęcia, o co pytasz. Czy możesz wyjaśnić swoje pytanie?
- dziękuję. Studiuję szeregi czasowe z podejściem klasycznym. Chcę, aby ktoś opisał tę grafikę i powiedział mi, czy ta grafika przedstawia reszty faktycznie losowe.
- Co ' przedstawia oś y (pionowa) na wykresie ?
- Dobrze jest przyjrzeć się rozkładowi reszt. Jednak ten histogram bardzo niewiele mówi o ich pozornej " losowości. " W tym celu musisz porównać reszty do innych posiadanych danych, w tym zmiennej zależnej i wszelkich innych zmiennych, które mogły nie być uwzględnione w dopasowywaniu. Chcesz, aby reszty wyglądały niezależnie od wszystkich innych zmiennych.
- Oprócz pomocnych komentarzy whuber ', możesz spróbować wykluczenie nielosowych wzorców reszt polega na utworzeniu wykresu rozrzutu reszt (na osi pionowej) względem zmiennej zależnej lub jej przewidywanych wartości (na osi poziomej). Idealnie byłoby, gdyby ktoś nie zauważył systematycznego wzrostu lub spadku średniej lub odchylenia podczas przesuwania od lewej do prawej.
Odpowiedź
Witamy w CrossValidated, Marco!
Jeśli dobrze Cię zrozumiałem, używasz narzędzia do szacowania najmniejszych kwadratów (LSE) problem regresji. Aby skutecznie działać, LSE rzeczywiście wymaga reszt o rozkładzie normalnym. Dobrym sposobem sprawdzenia tego jest przyjrzenie się tak zwanemu wykresowi Q-Q : rysujesz kwantyle uzyskanych reszt w porównaniu z teoretycznymi normalnymi kwantylami. Jeśli widzisz coś jako linię na wykresie QQ – gotowe – założenie o normalności jest spełnione.
Ale chcę Cię zachęcić do ostrożności, musisz również sprawdzić inne założenia wymagane dla LSE : niezależność reszt i homoskedastyczność .
Mam nadzieję, że to pomoże!
Komentarze
- Regresja liniowa wymaga normalnych błędów ??
- @kirk, sama regresja liniowa nie, ale estymator najmniejszych kwadratów dla regresji liniowej jest równoważny estymatorowi największej wiarygodności z błędami gaussowskimi. To ' jest powodem, dla którego często zakłada się, że rozkład błędów powinien być normalny. Jak wynika z pytania (odniesienie do krzywej dzwonowej), właśnie o to ma sprawdzić.
Odpowiedź
Najpierw narysowana krzywa nie jest dzwonkiem, którego” szukasz. Twój „dzwonek” powinien wyglądać mniej więcej tak:
Twój wykres słupkowy w formie wykresu wykresu słupkowego (yikes! Excel zachęca do strasznych rzeczy) wygląda dość blisko tego.
Jednak histogramy są niezbyt dobry sposób na sprawdzenie normalności reszt .
Jak omówiono tutaj , czasami – i w zależności od Twoje wybory dotyczące miejsca, w którym przechodzą słupki histogramu, ten sam zestaw wartości może wyglądać tak różnie, jak te:
Powtarzam – to dwa różne histogramy z tymi samymi liczbami. Szacunki gęstości jądra, a jeszcze lepiej wykresy QQ (przynajmniej gdy nauczysz się je czytać) są znacznie bardziej pouczające. Jeśli musisz używać histogramów, użyj wielu pojemników i zrób więcej niż jeden.