Chci provést ANCOVA analýzu dat týkajících se hustoty rostlinných epifytů. Nejprve bych chtěl vědět, jestli existuje nějaký rozdíl v hustotě rostlin mezi dvěma svahy, jedním N a jedním S, ale mám další údaje, jako je nadmořská výška, otevřenost vrchlíku a výška hostitelské rostliny. Vím, že mojí kovariátou by musely být dva svahy (N a S). Postavil jsem tento model, který běží v R a ačkoli nemám tušení, jestli funguje dobře. Také bych chtěl vědět, jaký je rozdíl, když používám symbol +
nebo *
.
model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1
Komentáře
- + vypočítá pouze hlavní efekty, * odhadne interakce mezi faktory spojenými s *. Rámečky ANCOVA obvykle odhadují pouze hlavní účinek spojitého faktoru, ale interakce mezi všemi seskupenými faktory.
Odpověď
Základním nástrojem je lm
; Všimněte si, že aov
je obal pro lm
.
Zejména pokud máte nějakou seskupovací proměnnou (faktor), $ g $ a souvislou proměnnou $ x $ , model y ~ x + g
by se hodil k hlavnímu modelu ANCOVA, zatímco y ~ x * g
by se hodil k modelu, který zahrnuje interakci s kovariátem. aov
použije stejné vzorce.
Věnujte zvláštní pozornost Note
v nápovědě k aov
.
Pokud jde o +
vs *
, russellpierce to do značné míry pokrývá, ale doporučuji vám podívat se na ?lm
a ?formula
a zejména na část 11.1 manuálu Úvod do R , který je dodáván s R (nebo ho můžete najít online, pokud jste nepřišli na to, jak jej najít v počítači; nejjednodušší je najít rozbalovací nabídka „Nápověda“ v R nebo RStudio).
Komentáře
odpověď
Doporučuji získávat a číst Objevování statistik pomocí R podle Fielda. Má pěknou sekci o ANCOVA.
Chcete-li spustit ANCOVA v R, načtěte následující balíčky:
car compute.es effects ggplot2 multcomp pastecs WRS
Pokud používáte lm
nebo aov
(používám aov
) nezapomeňte nastavit kontrasty pomocí „kontrastů“ „funkce před provedením aov
nebo lm
. R ve výchozím nastavení používá neortogonální kontrasty, které mohou v ANCOVA vše pokazit. Chcete-li nastavit ortogonální kontrasty, použijte:
contrasts(dataname$factorvariable)=contr.poly(# of levels, i.e. 3)
spusťte svůj model jako
model.1=aov(dv~covariate+factorvariable, data=dataname)
Chcete-li zobrazit model, použijte:
Anova(model.1, type="III")
Ujistěte se, že zde používáte velké „A“ Anova
anova
. To poskytne výsledky s použitím typu III SS.
summary.lm(model.1)
poskytne další shrnutí a zahrnuje R-sq. výstup.
posth=glht(model.1, linfct=mcp(factorvariable="Tukey")) ##gives the post-hoc Tukey analysis summary(posth) ##shows the output in a nice format.
Pokud chcete otestovat homogenitu regresních svahů, můžete také zahrnout termín interakce pro IV a kovariát. To by bylo:
model=aov(dv~covariate+IV+covariate:IV, data=dataname)
Pokud je výraz interakce významný, nemáte homogenitu.
Komentáře
- Proč neortogonální kontrasty kazí všechno?
- Chcete-li odpovědět na výše uvedenou otázku o “ proč neortogonální kontrasty nepořádek všechno je „. Odpověď je, že R je výchozí neortogonální (tj. Rozdíl mezi prostředky), což může způsobit problémy, pokud chcete vidět příspěvek každé IV zvlášť. Když zadáme ortogonální kontrasty, řekneme R, že chceme, aby SS pro IV ‚ byly úplně rozděleny a nepřekrývaly se. Tímto způsobem můžeme jasně a jasně vidět variaci přisuzovanou každému prediktoru. Pokud nezadáte, použije R standardně liberálnější přístup k kontrastu.
- Proč zájem o SS typu III?
Odpověď
Zde je doplňková dokumentace http://goo.gl/yxUZ1R postupu navrženého společností @Butorovich. Kromě toho pozoruji, že když je kovariát binární, použití shrnutí (lm.object) by poskytlo stejný odhad IV jako generování pomocí Anova (lm.object, type = „III“).
Komentáře
- Není jasné, že se má jednat o odpověď ‚. Že ano? Pokud ano, upřesněte prosím úpravu. Pokud se jedná o otázku, zeptejte se kliknutím na
ASK QUESTION
v horní části & položením otázky. Pak vám můžeme náležitě pomoci. - Souhlasím. Zpráva byla revidována jako (doplňková) odpověď na předchozí.
Odpověď
Používáme Regrese analýza k vytvoření modelů, které popisují účinek variací predikčních proměnných na proměnnou odezvy. Někdy, pokud máme kategorickou proměnnou s hodnotami jako Ano / Ne nebo Muž / Žena atd., Jednoduchá regresní analýza poskytne více výsledků pro každou hodnotu kategorické proměnné. V takovém scénáři můžeme studovat účinek kategorické proměnné tak, že ji použijeme spolu s predikční proměnnou a porovnáme regresní čáry pro každou úroveň kategorické proměnné. Taková analýza se nazývá Analýza kovariance nazývaná také ANCOVA.
Příklad
Vezměte v úvahu R
integrovaná data set mtcars
. V něm pozorujeme, že pole am
představuje typ přenosu (automatický nebo manuální). Jedná se o kategorickou proměnnou s hodnotami 0 a 1. Hodnota míle na galon (mpg
) automobilu na ní kromě hodnoty koňské síly (). Studujeme vliv hodnoty am
na regresi mezi mpg
a hp
. Provádí se to pomocí funkce aov()
, za kterou následuje funkce anova()
k porovnání několika regresí.
Vstupní data
Vytvořte datový rámec obsahující pole mpg
, hp
a am
ze sady dat mtcars
. Zde vezmeme mpg
jako proměnnou odezvy, hp
jako predikční proměnnou a am
jako kategorická proměnná.
input <- mtcars[,c("am","mpg","hp")] head(input)
Když provedeme výše uvedený kód, vytvoří následující výsledek:
am mpg hp Mazda RX4 1 21.0 110 Mazda RX4 Wag 1 21.0 110 Datsun 710 1 22.8 93 Hornet 4 Drive 0 21.4 110 Hornet Sportabout 0 18.7 175 Valiant 0 18.1 105
Analýza ANCOVA
Vytváříme regresní model, přičemž hp
používáme proměnnou prediktoru a mpg
jako proměnná odpovědi s přihlédnutím k interakci mezi am
a hp
.
Model s interakcí mezi kategorickou proměnnou a proměnná prediktoru
Vytvořit regresní model1
result1 <- aov(mpg~hp*am,data=mtcars) summary(result1)
Když provedeme výše uvedený kód, vytvoří následující výsledek:
Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 77.391 1.50e-09 *** am 1 202.2 202.2 23.072 4.75e-05 *** hp:am 1 0.0 0.0 0.001 0.981 Residuals 28 245.4 8.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05. Interakce mezi těmito dvěma proměnnými však není významná, protože hodnota p je větší než 0,05.
Model bez interakce mezi kategorickou proměnnou a predikční proměnnou
Vytvořte regresní model2
result2 <- aov(mpg~hp+am,data=mtcars) summary(result2)
Když provedeme výše uvedený kód, vytvoří následující výsledek:
Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 80.15 7.63e-10 *** am 1 202.2 202.2 23.89 3.46e-05 *** Residuals 29 245.4 8.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05.
Porovnání dvou modelů
Nyní můžeme porovnat tyto dva modely a dospět k závěru, zda je interakce proměnných skutečně zanedbatelná. K tomu použijeme funkci anova()
.
anova(result1,result2) Model 1: mpg ~ hp * am Model 2: mpg ~ hp + am Res.Df RSS Df Sum of Sq F Pr(>F) 1 28 245.43 2 29 245.44 -1 -0.0052515 6e-04 0.9806
Protože hodnota p je větší než 0,05, dospějeme k závěru, že interakce mezi výkonem koně a typem přenosu není významná. Najeto na galon tedy bude podobným způsobem záviset na koňské síle automobilu v režimu automatické i manuální převodovky.
Komentáře
- Takže který přišel jako první, tato odpověď nebo tento příspěvek v tutoriálech ukazují? tutorialspoint.com/r/r_analysis_of_covariance.htm . Měla by být tato odpověď vypuštěna jako plagiát? Nebo ukázaly výukové programy pouze kopírování odtud?
anova
(vy ‚ brzy zjistím, zda je dáváte ve špatném pořadí, protože některé SS budou negativní, pokud tak učiníte)