Ik bestudeer een univariate en discrete tijdreeks. Ik weet dat residuen effectief willekeurig moeten zijn en goed passen, en een belvorm moeten hebben.
Suggereert de onderstaande plot dat de residuen effectief zijn random?
Reacties
- Welkom op de site, @Marco. Ik heb geen idee wat je vraagt. Kunt u uw vraag toelichten?
- bedankt. Ik bestudeer een tijdreeks met een klassieke benadering. Ik wil dat iemand deze afbeelding beschrijft en me vertelt of deze afbeelding de residuen effectief willekeurig beschrijft.
- Wat ' s de y (verticale) as in de grafiek vertegenwoordigt ?
- Het is goed om te kijken hoe de reststoffen worden verdeeld. Dit histogram vertelt je echter heel weinig over hun schijnbare " willekeurigheid. " Daarvoor moet je vergelijken de residuen van andere gegevens die u heeft, inclusief de afhankelijke variabele en eventuele andere variabelen die mogelijk niet bij de aanpassing betrokken waren. U wilt dat de residuen er onafhankelijk uitzien van alle andere variabelen.
- Naast whuber ' s nuttige opmerkingen, is een manier om te proberen om niet-willekeurige patronen in residuen uit te sluiten, is het creëren van een spreidingsdiagram van de residuen (op de verticale as) tegen de afhankelijke variabele of de voorspelde waarden ervan (op de horizontale as). Idealiter zou men geen systematische toename of afname van het gemiddelde of de variatie zien als men van links naar rechts beweegt.
Answer
Welkom bij CrossValidated, Marco!
Als ik je goed heb begrepen, gebruik je Least Squares Estimator (LSE) voor je regressieprobleem. Om effectief te kunnen opereren, heeft LSE inderdaad normaal verdeelde reststoffen nodig. Een goede manier om dit te controleren, is door de zogenaamde Q-Q-plot te bekijken: u tekent de kwantielen van uw verkregen residuen versus theoretische normale kwantielen. Als je iets als een lijn in de QQ-plot ziet – je bent klaar – is de aanname van normaliteit vervuld.
Maar ik wil je aanmoedigen om voorzichtig te zijn, je moet ook andere aannames controleren die vereist zijn voor LSE : onafhankelijkheid van de residuen en homoscedasticiteit .
Ik hoop dat het zal helpen!
Reacties
- Lineaire regressie vereist normale fouten ??
- @kirk, lineaire regressie zelf niet, maar de Least Squares-schatter voor lineaire regressie is equivalent aan de Maximum Likelihood-schatter met Gaussiaanse fouten. Dat ' is de reden waarom vaak wordt aangenomen dat fouten normaal verdeeld moeten worden. En zoals ik uit de vraag krijg (verwijzing naar bell-curve), is dit precies wat er gevraagd wordt om te controleren.
Antwoord
Ten eerste is de curve die je hebt getekend niet de bel die je” zoekt. Je “bel” zou er meer zo uit moeten zien:
Je histogram-getekend-als-een-staafdiagram (yikes! Excel moedigt vreselijke dingen aan) ziet er redelijk dichtbij uit.
Histogrammen zijn echter niet een erg goede manier om te controleren op normaliteit van residuen .
Zoals hier besproken, soms – en afhankelijk van uw keuzes voor waar de histogrambalken naartoe gaan, de dezelfde reeks waarden kan er net zo verschillend uitzien:
Gewoon om te herhalen – dat zijn twee verschillende histogrammen van de dezelfde nummers. Kerneldichtheidschattingen en nog beter, QQ-plots (tenminste als u eenmaal leert hoe u ze moet lezen) zijn aanzienlijk informatiever. Als u histogrammen moet gebruiken, gebruik dan voldoende bakken en doe er meer dan één.