Jeg ønsker at udføre en ANCOVA-analyse af data vedrørende tætheden af planteepifytter. Først vil jeg gerne vide, om der er nogen forskel i plantetæthed mellem to skråninger, en N og en S, men jeg har andre data såsom højde, baldakinåbning og højde af værtsplanten. Jeg ved, at mit kovariat skulle være de to skråninger (N og S). Jeg byggede denne model, der kører i R, og selvom jeg ikke aner, om den klarer sig godt. Jeg vil også gerne vide, hvad forskellen er, hvis jeg bruger symbolet + eller *.

model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1 

Kommentarer

  • + beregner kun hovedeffekter, * estimerer interaktioner mellem faktorer forbundet med *. ANCOVA-rammer estimerer normalt kun en hovedeffekt af den kontinuerlige faktor, men interaktioner mellem alle grupperede faktorer.

Svar

Det grundlæggende værktøj til dette er lm; bemærk, at aov er en indpakning til lm.

Især hvis du har en grupperingsvariabel (faktor), $ g $ og en kontinuerlig kovariat $ x $ , modellen y ~ x + g passer til en ANCOVA-model med hovedeffekter, mens y ~ x * g passer til en model, der inkluderer interaktion med kovariatet. aov tager de samme formler.

Vær særlig opmærksom på Note i hjælp på aov.

Hvad angår + vs *, russellpierce dækker stort set det, men jeg vil anbefale dig at kigge på ?lm og ?formula og især afsnit 11.1 i manualen En introduktion til R , der følger med R (eller du kan finde den online, hvis du ikke har fundet ud af, hvordan du finder den på din computer; lettest involverer dette at finde rullemenuen “Hjælp” i enten R eller RStudio).

Kommentarer

  • antag, at jeg har to gruppefaktorer $ g_1, g_2 $ og to covariate $ x_1, x_2 $, hvor min model er $$ y_ {ij} = \ mu + \ alpha_i + \ eta_j + x_ {ij1} \ gamma_1 + x_ {ij2} \ gamma_2 + \ epsilon_ {ij} $$ Gør y ~ g_1 + g_2 + x_1 + x_2 gør det samme trick? Tester F-værdierne opnået mod x_1 og x_2 henholdsvis $ \ gamma_1 = 0 $ og $ \ gamma_2 = 0 $?
  • Ikke sikker på, hvordan jeg gik glip af dette. Ja. …. og hvis du vil teste begge på én gang, skal du passe både med og uden dem og videregive de monterede lm-objekter til anova (du ‘ ll snart se om du giver dem i den forkerte rækkefølge, fordi nogle SS vil være negative, hvis du gør det)

Svar

Jeg anbefaler at hente og læse Opdage statistik ved hjælp af R efter felt. Han har et dejligt afsnit om ANCOVA.

For at køre ANCOVA i R skal du indlæse følgende pakker:

car compute.es effects ggplot2 multcomp pastecs WRS 

Hvis du bruger lm eller aov (jeg bruger aov) skal du sørge for at indstille kontraster ved hjælp af “kontrasterne “funktion, før du udfører enten aov eller lm. R bruger ikke-ortogonale kontraster som standard, som kan ødelægge alt i en ANCOVA. Hvis du vil indstille ortogonale kontraster, skal du bruge:

contrasts(dataname$factorvariable)=contr.poly(# of levels, i.e. 3) 

så kør din model som

model.1=aov(dv~covariate+factorvariable, data=dataname) 

For at se modelbrug:

Anova(model.1, type="III") 

Sørg for at bruge stort “A” Anova her og ikke anova. Dette giver resultater ved hjælp af type III SS.

summary.lm(model.1) giver et andet resumé og inkluderer R-sq. produktion.

posth=glht(model.1, linfct=mcp(factorvariable="Tukey")) ##gives the post-hoc Tukey analysis summary(posth) ##shows the output in a nice format. 

Hvis du vil teste for homogenitet af regressionshældninger, kan du også medtage et interaktionsudtryk for IV og kovariat. Det ville være:

model=aov(dv~covariate+IV+covariate:IV, data=dataname) 

Hvis interaktionsudtrykket er signifikant, har du ikke homogenitet.

Kommentarer

  • Hvorfor ødelægger ikke-ortogonale kontraster alt?
  • For at besvare ovenstående spørgsmål om ” hvorfor ikke-ortogonale kontraster rod alt op “. Svaret er, at R som standard ikke er ortogonal (dvs. forskel mellem midler), hvilket kan forårsage problemer, hvis du vil se bidraget fra hver IV separat. Når vi specificerer ortogonale kontraster, fortæller vi R, at vi ønsker, at SS til IV ‘ skal være fuldstændigt opdelt og ikke overlappende. På denne måde kan vi se den variation, der tilskrives hver forudsigelse, rent og tydeligt. Hvis du ikke specificerer, er R som standard en mere liberal tilgang til kontrasten.
  • Hvorfor er interessen for type III SS?

Svar

Her er en supplerende dokumentation http://goo.gl/yxUZ1R af proceduren foreslået af @Butorovich. Derudover er min observation, at når kovariatet er binært, ville brug af resume (lm.object) give samme IV-estimat som genereret af Anova (lm.object, type = “III”).

Kommentarer

  • Det er ikke ‘ det er klart, at dette formodes at være et svar. Er det? Hvis ja, skal du redigere for at afklare. Hvis det er et spørgsmål, så spørg ved at klikke på ASK QUESTION øverst & og bede det der. Så kan vi hjælpe dig ordentligt.
  • Aftalt. Beskeden er revideret som et (supplerende) svar på det foregående.

Svar

Vi bruger regression analyse for at skabe modeller, der beskriver effekten af variation i forudsigelsesvariabler på responsvariablen. Nogle gange, hvis vi har en kategorisk variabel med værdier som Ja / Nej eller Mand / Kvinde osv., Giver den enkle regressionsanalyse flere resultater for hver værdi af den kategoriske variabel. I et sådant scenario kan vi studere effekten af den kategoriske variabel ved at bruge den sammen med forudsigelsesvariablen og sammenligne regressionslinjerne for hvert niveau af den kategoriske variabel. En sådan analyse kaldes Analyse af kovarians, også kaldet ANCOVA.

Eksempel
Overvej de R indbyggede data indstil mtcars. I det observerer vi, at feltet am repræsenterer transmissionstypen (auto eller manuel). Det er en kategorisk variabel med værdierne 0 og 1. Kilometerværdien (mpg) for en bil kan også afhænge af den udover værdien af hestekraft (hp). Vi studerer effekten af værdien af am på regressionen mellem mpg og hp. Det gøres ved hjælp af funktionen aov() efterfulgt af anova() -funktionen til at sammenligne de flere regressioner.

Inputdata
Opret en dataramme, der indeholder felterne mpg, hp og am fra datasættet mtcars. Her tager vi mpg som responsvariabel, hp som forudsigelsesvariabel og am som den kategoriske variabel.

input <- mtcars[,c("am","mpg","hp")] head(input) 

Når vi udfører ovenstående kode, giver den følgende resultat:

 am mpg hp Mazda RX4 1 21.0 110 Mazda RX4 Wag 1 21.0 110 Datsun 710 1 22.8 93 Hornet 4 Drive 0 21.4 110 Hornet Sportabout 0 18.7 175 Valiant 0 18.1 105 

ANCOVA-analyse
Vi opretter en regressionsmodel, der tager hp som forudsigelsesvariabel og mpg som responsvariabel under hensyntagen til interaktionen mellem am og hp.

Model med interaktion mellem kategorisk variabel og forudsigelsesvariabel

Opret regressionsmodel1

result1 <- aov(mpg~hp*am,data=mtcars) summary(result1) 

Når vi udfører ovenstående kode, producerer den følgende resultat:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 77.391 1.50e-09 *** am 1 202.2 202.2 23.072 4.75e-05 *** hp:am 1 0.0 0.0 0.001 0.981 Residuals 28 245.4 8.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Dette resultat viser, at både hestekraft og transmissionstype har signifikant effekt på miles pr. gallon, da p-værdien i begge tilfælde er mindre end 0,05. Men interaktionen mellem disse to variabler er ikke signifikant, da p-værdien er mere end 0,05.

Model uden interaktion mellem kategorisk variabel og forudsigelsesvariabel

Opret regressionsmodel2

result2 <- aov(mpg~hp+am,data=mtcars) summary(result2) 

Når vi udfører ovenstående kode, giver det følgende resultat:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 80.15 7.63e-10 *** am 1 202.2 202.2 23.89 3.46e-05 *** Residuals 29 245.4 8.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Dette resultat viser, at både hestekraft og transmissionstype har signifikant effekt på miles pr. gallon, da p-værdien i begge tilfælde er mindre end 0,05.

Sammenligning af to modeller
Nu kan vi sammenligne de to modeller for at konkludere, hvis interaktionen mellem variablerne virkelig er ubetydelig. Til dette bruger vi funktionen anova().

 anova(result1,result2) Model 1: mpg ~ hp * am Model 2: mpg ~ hp + am Res.Df RSS Df Sum of Sq F Pr(>F) 1 28 245.43 2 29 245.44 -1 -0.0052515 6e-04 0.9806 

Da p-værdien er større end 0,05, konkluderer vi, at samspillet mellem hestekraft og transmissionstype er ikke signifikant. Så kilometertal pr. Gallon afhænger på samme måde af bilens hestekraft i både automatisk og manuel transmissionstilstand.

Kommentarer

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *