Jak provést ANCOVA v R

Question

Chci provést ANCOVA analýzu dat týkajících se hustoty rostlinných epifytů. Nejprve bych chtěl vědět, jestli existuje nějaký rozdíl v hustotě rostlin mezi dvěma svahy, jedním N a jedním S, ale mám další údaje, jako je nadmořská výška, otevřenost vrchlíku a výška hostitelské rostliny. Vím, že mojí kovariátou by musely být dva svahy (N a S). Postavil jsem tento model, který běží v R a ačkoli nemám tušení, jestli funguje dobře. Také bych chtěl vědět, jaký je rozdíl, když používám symbol + nebo *.

model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1

Komentáře

+ vypočítá pouze hlavní efekty, * odhadne interakce mezi faktory spojenými s *. Rámečky ANCOVA obvykle odhadují pouze hlavní účinek spojitého faktoru, ale interakce mezi všemi seskupenými faktory.

Answer 1

Základním nástrojem je lm; Všimněte si, že aov je obal pro lm.

Zejména pokud máte nějakou seskupovací proměnnou (faktor), $ g $ a souvislou proměnnou $ x $ , model y ~ x + g by se hodil k hlavnímu modelu ANCOVA, zatímco y ~ x * g by se hodil k modelu, který zahrnuje interakci s kovariátem. aov použije stejné vzorce.

Věnujte zvláštní pozornost Note v nápovědě k aov.

Pokud jde o + vs *, russellpierce to do značné míry pokrývá, ale doporučuji vám podívat se na ?lm a ?formula a zejména na část 11.1 manuálu Úvod do R , který je dodáván s R (nebo ho můžete najít online, pokud jste nepřišli na to, jak jej najít v počítači; nejjednodušší je najít rozbalovací nabídka „Nápověda“ v R nebo RStudio).

Komentáře

předpokládám, že mám dva skupinové faktory $ g_1, g_2 $ a dvě proměnné $ x_1, x_2 $, přičemž můj model bude $$ y_ {ij} = \ mu + \ alpha_i + \ eta_j + x_ {ij1} \ gamma_1 + x_ {ij2} \ gamma_2 + \ epsilon_ {ij} $$ Má y ~ g_1 + g_2 + x_1 + x_2 dělá stejný trik? Testují hodnoty F získané proti x_1 a x_2 $ \ gamma_1 = 0 $ a $ \ gamma_2 = 0 $?
Nevím, jak mi to uniklo. Ano. …. a pokud chcete vyzkoušet oba najednou, přizpůsobte je jak s nimi, tak bez nich a předejte přizpůsobené objekty lm anova (vy ‚ brzy zjistím, zda je dáváte ve špatném pořadí, protože některé SS budou negativní, pokud tak učiníte)

Answer 2

Zde je doplňková dokumentace http://goo.gl/yxUZ1R postupu navrženého společností @Butorovich. Kromě toho pozoruji, že když je kovariát binární, použití shrnutí (lm.object) by poskytlo stejný odhad IV jako generování pomocí Anova (lm.object, type = „III“).

Komentáře

Není jasné, že se má jednat o odpověď ‚. Že ano? Pokud ano, upřesněte prosím úpravu. Pokud se jedná o otázku, zeptejte se kliknutím na ASK QUESTION v horní části & položením otázky. Pak vám můžeme náležitě pomoci.
Souhlasím. Zpráva byla revidována jako (doplňková) odpověď na předchozí.

Answer 3

Používáme Regrese analýza k vytvoření modelů, které popisují účinek variací predikčních proměnných na proměnnou odezvy. Někdy, pokud máme kategorickou proměnnou s hodnotami jako Ano / Ne nebo Muž / Žena atd., Jednoduchá regresní analýza poskytne více výsledků pro každou hodnotu kategorické proměnné. V takovém scénáři můžeme studovat účinek kategorické proměnné tak, že ji použijeme spolu s predikční proměnnou a porovnáme regresní čáry pro každou úroveň kategorické proměnné. Taková analýza se nazývá Analýza kovariance nazývaná také ANCOVA.

Příklad
Vezměte v úvahu R integrovaná data set mtcars. V něm pozorujeme, že pole am představuje typ přenosu (automatický nebo manuální). Jedná se o kategorickou proměnnou s hodnotami 0 a 1. Hodnota míle na galon (mpg) automobilu na ní kromě hodnoty koňské síly (). Studujeme vliv hodnoty am na regresi mezi mpg a hp. Provádí se to pomocí funkce aov(), za kterou následuje funkce anova() k porovnání několika regresí.

Vstupní data
Vytvořte datový rámec obsahující pole mpg, hp a am ze sady dat mtcars. Zde vezmeme mpg jako proměnnou odezvy, hp jako predikční proměnnou a am jako kategorická proměnná.

input <- mtcars[,c("am","mpg","hp")] head(input)

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 am mpg hp Mazda RX4 1 21.0 110 Mazda RX4 Wag 1 21.0 110 Datsun 710 1 22.8 93 Hornet 4 Drive 0 21.4 110 Hornet Sportabout 0 18.7 175 Valiant 0 18.1 105

Analýza ANCOVA
Vytváříme regresní model, přičemž hp používáme proměnnou prediktoru a mpg jako proměnná odpovědi s přihlédnutím k interakci mezi am a hp.

Model s interakcí mezi kategorickou proměnnou a proměnná prediktoru

Vytvořit regresní model1

result1 <- aov(mpg~hp*am,data=mtcars) summary(result1)

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 77.391 1.50e-09 *** am 1 202.2 202.2 23.072 4.75e-05 *** hp:am 1 0.0 0.0 0.001 0.981 Residuals 28 245.4 8.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05. Interakce mezi těmito dvěma proměnnými však není významná, protože hodnota p je větší než 0,05.

Model bez interakce mezi kategorickou proměnnou a predikční proměnnou

Vytvořte regresní model2

result2 <- aov(mpg~hp+am,data=mtcars) summary(result2)

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 80.15 7.63e-10 *** am 1 202.2 202.2 23.89 3.46e-05 *** Residuals 29 245.4 8.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05.

Porovnání dvou modelů
Nyní můžeme porovnat tyto dva modely a dospět k závěru, zda je interakce proměnných skutečně zanedbatelná. K tomu použijeme funkci anova().

 anova(result1,result2) Model 1: mpg ~ hp * am Model 2: mpg ~ hp + am Res.Df RSS Df Sum of Sq F Pr(>F) 1 28 245.43 2 29 245.44 -1 -0.0052515 6e-04 0.9806

Protože hodnota p je větší než 0,05, dospějeme k závěru, že interakce mezi výkonem koně a typem přenosu není významná. Najeto na galon tedy bude podobným způsobem záviset na koňské síle automobilu v režimu automatické i manuální převodovky.

Komentáře

Takže který přišel jako první, tato odpověď nebo tento příspěvek v tutoriálech ukazují? tutorialspoint.com/r/r_analysis_of_covariance.htm . Měla by být tato odpověď vypuštěna jako plagiát? Nebo ukázaly výukové programy pouze kopírování odtud?

Jak provést ANCOVA v R

Komentáře

Odpověď

Komentáře

odpověď

Komentáře

Odpověď

Komentáře

Odpověď

Komentáře

Napsat komentář Zrušit odpověď na komentář