Studuji jednorozměrnou a diskrétní časovou řadu. Vím, že zbytky by měly být skutečně náhodné a měly by dobře sedět a měly by mít tvar zvonu.
Naznačuje níže uvedený graf, že zbytky jsou skutečně random?
Komentáře
- Vítejte na webu, @Marco. Netuším, na co se ptáte. Můžete objasnit svou otázku?
- děkuji. Studuji časovou řadu s klasickým přístupem. Chci, aby někdo popsal tuto grafiku a řekl mi, jestli tato grafika popisuje zbytky skutečně náhodné.
- Co ' s (svislá) osa v grafu představuje ?
- Je dobré se podívat, jak jsou zbytky distribuovány. Tento histogram vám však říká jen velmi málo o jejich zjevné " náhodnosti. " K tomu je třeba porovnat zbytky k dalším údajům, které máte, včetně závislé proměnné a jakýchkoli dalších proměnných, které by se na tvarování nemuseli podílet. Chcete, aby zbytky vypadaly nezávisle na všech ostatních proměnných.
- Kromě užitečných komentářů whuber ' existuje jeden způsob, jak zkusit vyloučit nenáhodné vzory reziduí je vytvoření bodového grafu reziduí (na svislé ose) proti závislé proměnné nebo jejím předpokládaným hodnotám (na vodorovné ose). V ideálním případě by nebylo vidět žádné systematické zvyšování nebo snižování střední hodnoty nebo variace při pohybu zleva doprava.
Odpověď
Vítejte v CrossValidated, Marco!
Pokud jsem vám správně rozuměl, používáte odhad minimálních čtverců (LSE) pro svůj regresní problém. Aby fungoval efektivně, LSE skutečně vyžaduje normálně distribuované zbytky. Dobrým způsobem, jak to zkontrolovat, je podívat se na takzvaný graf Q-Q : nakreslíte kvantily získaných reziduí versus teoretické normální kvantily. Pokud vidíte něco jako čáru v grafu QQ – jste hotovi – předpoklad normality je splněn.
Chtěl bych vás však povzbudit, abyste byli opatrní, musíte také zkontrolovat další předpoklady požadované pro LSE : nezávislost reziduí a homoscedasticity .
Doufám, že to pomůže!
Komentáře
- Lineární regrese vyžaduje normální chyby ??
- @kirk, lineární regrese sama o sobě není, ale odhadce nejmenších čtverců pro lineární regrese je ekvivalentní odhadu maximální pravděpodobnosti s gaussovskými chybami. Proto se ' často předpokládá, že by chyby měly být distribuovány normálně. A jak se dostávám z otázky (odkaz na křivku zvonu), je to přesně to, co je třeba zkontrolovat.
Odpověď
Nejprve křivka, kterou jste nakreslili, není zvon, který hledáte. Váš“ zvon „by měl vypadat spíše takto:
Váš histogram nakreslený jako sloupcový graf (jo! Excel podporuje hrozné věci) vypadá přiměřeně blízko.
Histogramy jsou však není moc dobrý způsob, jak zkontrolovat normálnost reziduí .
Jak je uvedeno zde , příležitostně – a v závislosti na při výběru toho, kam se pruhy histogramu dostanou, může stejná sada hodnot vypadat takto odlišně:
Opakuji – to jsou dva různé histogramy stejných čísel. Odhady hustoty jádra a ještě lépe, grafy QQ (alespoň jakmile se naučíte, jak je číst) jsou podstatně více informativní. Pokud musíte použít histogramy, použijte spoustu košů a proveďte více než jeden.