Betegnelserne – Homoscedasticitet og homogenitet af effektstørrelser bruges ofte med hensyn til regressionsanalyse / Anova. Disse antagelser skaber i det mindste meget forvirring i mine øjne . Jeg er ikke klar over, hvordan effektstørrelser er homoscdasticitet? Hvor forskelligt er det fra antagelsen om varians af varians for Anova? Er disse antagelser relevante for f.eks. meta-analyse af korrelation / effektstørrelse d?
Kommentarer
- Homoscedasticitet betyder lige store afvigelser. Jeg ville forvente, at når homogenitet nævnes i en statistisk sammenhæng, ville det også antyde, at noget i gennemsnit er konstant, men hvad der afhænger af kontekst. Når du ikke ' ikke forklarer tvivlen (" måske "?) Og giver præcist nul bevis for påstanden om " en masse forvirringer " Jeg kan kun matche dine to sætninger med mine to sætninger. Dette giver i det væsentlige et minimalt stof at reagere på. Jeg ' kalder det en mangel på forskningsindsats.
- Subhash, hvis du kunne redigere dit spørgsmål for at forklare, hvad du mener med " homogenitet " – som ude af sammenhæng er et vagt udtryk – så ville det være mindre problematisk at svare.
- Det afhænger af, hvad ting, vi overvejer homogeniteten af. Homogenitet af varians er homoscedasticitet. Homogenitet af noget, der adskiller sig fra varians, adskiller sig fra homoscedasticitet.
- Det ' er virkelig bizart, at du besluttede at acceptere et nyt svar, der nu har – 4 downvotes i stedet for gung ' s svar med +9 upvotes. At ' er et virkelig mærkeligt valg. Jeg nedstemte dit spørgsmål (-1) for at styre andre brugere væk fra denne tråd.
Svar
Jeg er uenig med hvert svar her. Homogenitet af varians betyder ens varians blandt grupperede scatterplots. Homoskadasticitet er en normalfordeling, der forekommer for hvert punkt på x-aksen (forudsigelsesvariabel), så der skal være en lignende kurtose på tværs af hvert punkt i forudsigelsesvariablen, der kan virke som varianshomogenitet, men det er ikke den samme ting.
Kommentarer
- Homoscedasticity [ikke scad ] betyder slet ikke en normalfordeling. Som dets rødder antyder, drejer det sig om (omtrent) lige spredning uden noget andet underforstået. Homoscedasticitet indebærer heller ikke, at vi har en kontinuerlig akse hvor som helst, da det også kunne defineres for kvalitativt særskilte fordelinger. Her er et trivielt eksempel. Jeg forestiller mig flere ensartede fordelinger på det samme interval. Det følger straks, at de har den samme varians, og opsætningen er homoscedastisk.
- Lignende (endda lige) kurtose er også meget forskellig fra lige varians. Den samme kurtose er i overensstemmelse med forskellig variation. Mere generelt annoncerer du ' her uenighed: ja, hvad er der nøjagtigt galt med det eksisterende svar (jeg tæller kun et)?
- Denne karakterisering af homoscedasticitet er så langt fra den sædvanlige betydning, at jeg føler mig forpligtet til at nedstemme svaret som en advarsel til dem, der måske er nye i begrebet. Jeg ville ændre denne stemme, hvis svaret blev redigeret til at omfatte en tilgængelig, autoritativ henvisning til støtte for det.
- Dette svar skal understøtte dets påstande
- Jeg kiggede på dine links, men kunne finde intet i dem, der understøtter dine krav. Begge illustrerer den konventionelle betydning af heteroscedasticitet. Hverken påberåber sig normalitet eller kurtose i definitionen. (Kurtosis har forresten ikke meget at gøre med formen på normalfordelingen og er ikke synonymt med den). Således modsiger de dit svar snarere end at støtte det. Jeg tror, at grunden til, at @NickCox påpegede, at den korrekte stavemåde ikke var kritisk, men kun for at hjælpe læserne med at søge relateret materiale. (Søgemaskinen på dette websted kan ikke identificere stavefejl.)
Svar
( Bemærk: Ved “homogenitet” antager jeg, at du mener “varians ensartethed”. )
De er i det væsentlige to forskellige navne for den samme antagelse, som man måske kalder mere dagligdags engelsk “konstant variation af fejlene” (selvfølgelig har vi i praksis ikke adgang til de sande fejl, kun de resterende, hvilket er det, vi faktisk kontrollerer). Udtrykket “homogenitet af varians” anvendes traditionelt i ANOVA-sammenhængen, og “homoscedasticitet” anvendes mere almindeligt i regressionskonteksten. Men de betyder begge, at varianterne af resterne er de samme overalt.
Hvis du har problemer med at forstå homo- / heteroscedasticitet, har jeg flere indlæg om emnet, der kan være nyttige for dig:
- Sådan forstå hvad homoscedasticitet er, og tjek heteroscedasticitet: Hvad betyder “konstant varians” i en lineær regressionsmodel?
- effekt af heteroscedasticitet på statistisk effekt: Effektivitet af beta-estimater med heteroscedasticty
- Mulige alternative strategier når du har heteroscedasticitet: Alternativer til envejs ANOVA for heteroscedastiske data
Kommentarer
- Typo her @Gung: det er homosc. det indebærer, at variansen er den samme. Strengt taget homosc. er en antagelse om fejl eller betingede fordelinger, ikke rester.
- Homegeneity har også en bredere betydning af prøver, der er ens i en eller anden forstand, dvs. i modsætning til heterogenitet.
- I ' d sig det ' s normalt givet fuldt ud som " variansens homogenitet " – som @Aksakal siger, " homogenitet " er bredere. [Jeg tog friheden til at rette den skrivefejl, som Nick påpegede.]
- Dette er nyttigt, men jeg ville kvalificere det lidt. For eksempel har jeg ' set referencer til homogenitet i forhold til muligvis blandede distributioner i det tilfælde, hvor en distribution er fra en enkelt kilde; og i forhold til rumlige processer. Så homogenitet behøver ikke at betyde varianshomogenitet. For alt hvad jeg ved, går dette ud over, hvad OP havde for øje, men det ' en retfærdig kommentar i betragtning af den nuværende ordlyd af spørgsmålet.
- Godt punkt, @NickCox. Jeg tilføjede en advarsel.