Chci provést ANCOVA analýzu dat týkajících se hustoty rostlinných epifytů. Nejprve bych chtěl vědět, jestli existuje nějaký rozdíl v hustotě rostlin mezi dvěma svahy, jedním N a jedním S, ale mám další údaje, jako je nadmořská výška, otevřenost vrchlíku a výška hostitelské rostliny. Vím, že mojí kovariátou by musely být dva svahy (N a S). Postavil jsem tento model, který běží v R a ačkoli nemám tušení, jestli funguje dobře. Také bych chtěl vědět, jaký je rozdíl, když používám symbol + nebo *.

model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1 

Komentáře

  • + vypočítá pouze hlavní efekty, * odhadne interakce mezi faktory spojenými s *. Rámečky ANCOVA obvykle odhadují pouze hlavní účinek spojitého faktoru, ale interakce mezi všemi seskupenými faktory.

Odpověď

Základním nástrojem je lm; Všimněte si, že aov je obal pro lm.

Zejména pokud máte nějakou seskupovací proměnnou (faktor), $ g $ a souvislou proměnnou $ x $ , model y ~ x + g by se hodil k hlavnímu modelu ANCOVA, zatímco y ~ x * g by se hodil k modelu, který zahrnuje interakci s kovariátem. aov použije stejné vzorce.

Věnujte zvláštní pozornost Note v nápovědě k aov.

Pokud jde o + vs *, russellpierce to do značné míry pokrývá, ale doporučuji vám podívat se na ?lm a ?formula a zejména na část 11.1 manuálu Úvod do R , který je dodáván s R (nebo ho můžete najít online, pokud jste nepřišli na to, jak jej najít v počítači; nejjednodušší je najít rozbalovací nabídka „Nápověda“ v R nebo RStudio).

Komentáře

  • předpokládám, že mám dva skupinové faktory $ g_1, g_2 $ a dvě proměnné $ x_1, x_2 $, přičemž můj model bude $$ y_ {ij} = \ mu + \ alpha_i + \ eta_j + x_ {ij1} \ gamma_1 + x_ {ij2} \ gamma_2 + \ epsilon_ {ij} $$ Má y ~ g_1 + g_2 + x_1 + x_2 dělá stejný trik? Testují hodnoty F získané proti x_1 a x_2 $ \ gamma_1 = 0 $ a $ \ gamma_2 = 0 $?
  • Nevím, jak mi to uniklo. Ano. …. a pokud chcete vyzkoušet oba najednou, přizpůsobte je jak s nimi, tak bez nich a předejte přizpůsobené objekty lm anova (vy ‚ brzy zjistím, zda je dáváte ve špatném pořadí, protože některé SS budou negativní, pokud tak učiníte)

odpověď

Doporučuji získávat a číst Objevování statistik pomocí R podle Fielda. Má pěknou sekci o ANCOVA.

Chcete-li spustit ANCOVA v R, načtěte následující balíčky:

car compute.es effects ggplot2 multcomp pastecs WRS 

Pokud používáte lm nebo aov (používám aov) nezapomeňte nastavit kontrasty pomocí „kontrastů“ „funkce před provedením aov nebo lm. R ve výchozím nastavení používá neortogonální kontrasty, které mohou v ANCOVA vše pokazit. Chcete-li nastavit ortogonální kontrasty, použijte:

contrasts(dataname$factorvariable)=contr.poly(# of levels, i.e. 3) 

spusťte svůj model jako

model.1=aov(dv~covariate+factorvariable, data=dataname) 

Chcete-li zobrazit model, použijte:

Anova(model.1, type="III") 

Ujistěte se, že zde používáte velké „A“ Anova anova. To poskytne výsledky s použitím typu III SS.

summary.lm(model.1) poskytne další shrnutí a zahrnuje R-sq. výstup.

posth=glht(model.1, linfct=mcp(factorvariable="Tukey")) ##gives the post-hoc Tukey analysis summary(posth) ##shows the output in a nice format. 

Pokud chcete otestovat homogenitu regresních svahů, můžete také zahrnout termín interakce pro IV a kovariát. To by bylo:

model=aov(dv~covariate+IV+covariate:IV, data=dataname) 

Pokud je výraz interakce významný, nemáte homogenitu.

Komentáře

  • Proč neortogonální kontrasty kazí všechno?
  • Chcete-li odpovědět na výše uvedenou otázku o “ proč neortogonální kontrasty nepořádek všechno je „. Odpověď je, že R je výchozí neortogonální (tj. Rozdíl mezi prostředky), což může způsobit problémy, pokud chcete vidět příspěvek každé IV zvlášť. Když zadáme ortogonální kontrasty, řekneme R, že chceme, aby SS pro IV ‚ byly úplně rozděleny a nepřekrývaly se. Tímto způsobem můžeme jasně a jasně vidět variaci přisuzovanou každému prediktoru. Pokud nezadáte, použije R standardně liberálnější přístup k kontrastu.
  • Proč zájem o SS typu III?

Odpověď

Zde je doplňková dokumentace http://goo.gl/yxUZ1R postupu navrženého společností @Butorovich. Kromě toho pozoruji, že když je kovariát binární, použití shrnutí (lm.object) by poskytlo stejný odhad IV jako generování pomocí Anova (lm.object, type = „III“).

Komentáře

  • Není jasné, že se má jednat o odpověď ‚. Že ano? Pokud ano, upřesněte prosím úpravu. Pokud se jedná o otázku, zeptejte se kliknutím na ASK QUESTION v horní části & položením otázky. Pak vám můžeme náležitě pomoci.
  • Souhlasím. Zpráva byla revidována jako (doplňková) odpověď na předchozí.

Odpověď

Používáme Regrese analýza k vytvoření modelů, které popisují účinek variací predikčních proměnných na proměnnou odezvy. Někdy, pokud máme kategorickou proměnnou s hodnotami jako Ano / Ne nebo Muž / Žena atd., Jednoduchá regresní analýza poskytne více výsledků pro každou hodnotu kategorické proměnné. V takovém scénáři můžeme studovat účinek kategorické proměnné tak, že ji použijeme spolu s predikční proměnnou a porovnáme regresní čáry pro každou úroveň kategorické proměnné. Taková analýza se nazývá Analýza kovariance nazývaná také ANCOVA.

Příklad
Vezměte v úvahu R integrovaná data set mtcars. V něm pozorujeme, že pole am představuje typ přenosu (automatický nebo manuální). Jedná se o kategorickou proměnnou s hodnotami 0 a 1. Hodnota míle na galon (mpg) automobilu na ní kromě hodnoty koňské síly (). Studujeme vliv hodnoty am na regresi mezi mpg a hp. Provádí se to pomocí funkce aov(), za kterou následuje funkce anova() k porovnání několika regresí.

Vstupní data
Vytvořte datový rámec obsahující pole mpg, hp a am ze sady dat mtcars. Zde vezmeme mpg jako proměnnou odezvy, hp jako predikční proměnnou a am jako kategorická proměnná.

input <- mtcars[,c("am","mpg","hp")] head(input) 

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 am mpg hp Mazda RX4 1 21.0 110 Mazda RX4 Wag 1 21.0 110 Datsun 710 1 22.8 93 Hornet 4 Drive 0 21.4 110 Hornet Sportabout 0 18.7 175 Valiant 0 18.1 105 

Analýza ANCOVA
Vytváříme regresní model, přičemž hp používáme proměnnou prediktoru a mpg jako proměnná odpovědi s přihlédnutím k interakci mezi am a hp.

Model s interakcí mezi kategorickou proměnnou a proměnná prediktoru

Vytvořit regresní model1

result1 <- aov(mpg~hp*am,data=mtcars) summary(result1) 

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 77.391 1.50e-09 *** am 1 202.2 202.2 23.072 4.75e-05 *** hp:am 1 0.0 0.0 0.001 0.981 Residuals 28 245.4 8.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05. Interakce mezi těmito dvěma proměnnými však není významná, protože hodnota p je větší než 0,05.

Model bez interakce mezi kategorickou proměnnou a predikční proměnnou

Vytvořte regresní model2

result2 <- aov(mpg~hp+am,data=mtcars) summary(result2) 

Když provedeme výše uvedený kód, vytvoří následující výsledek:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 80.15 7.63e-10 *** am 1 202.2 202.2 23.89 3.46e-05 *** Residuals 29 245.4 8.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Tento výsledek ukazuje, že jak výkon koně, tak typ přenosu mají významný vliv na míle na galon, protože hodnota p je v obou případech menší než 0,05.

Porovnání dvou modelů
Nyní můžeme porovnat tyto dva modely a dospět k závěru, zda je interakce proměnných skutečně zanedbatelná. K tomu použijeme funkci anova().

 anova(result1,result2) Model 1: mpg ~ hp * am Model 2: mpg ~ hp + am Res.Df RSS Df Sum of Sq F Pr(>F) 1 28 245.43 2 29 245.44 -1 -0.0052515 6e-04 0.9806 

Protože hodnota p je větší než 0,05, dospějeme k závěru, že interakce mezi výkonem koně a typem přenosu není významná. Najeto na galon tedy bude podobným způsobem záviset na koňské síle automobilu v režimu automatické i manuální převodovky.

Komentáře

  • Takže který přišel jako první, tato odpověď nebo tento příspěvek v tutoriálech ukazují? tutorialspoint.com/r/r_analysis_of_covariance.htm . Měla by být tato odpověď vypuštěna jako plagiát? Nebo ukázaly výukové programy pouze kopírování odtud?

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *