ANCOVA elemzést szeretnék végezni a növényi epifiták sűrűségére vonatkozó adatokról. Eleinte azt szeretném tudni, hogy van-e különbség a növény sűrűségében két lejtőn, egy N és egy S között, de más adatokkal is rendelkezem, például a magasságról, a lombkorona nyitottságáról és a gazda növény magasságáról. Tudom, hogy a kovariámnak a két lejtőnek (É és É) kell lennie. Megépítettem ezt a R-ben futó modellt, és bár fogalmam sincs, hogy jól teljesít-e. Szeretném tudni, mi a különbség, ha a + vagy a * szimbólumot használom.

model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1 

Megjegyzések

  • + csak a fő hatásokat számítja ki, a * meg fogja becsülni a * -hoz kapcsolódó tényezők közötti kölcsönhatásokat. Az ANCOVA keretrendszerek általában csak a folyamatos tényező fő hatását becsülik meg, de az összes csoportosított tényező közötti kölcsönhatásokat.

Válasz

Ennek alapvető eszköze a lm; vegye figyelembe, hogy a aov a lm csomagolója.

Különösen, ha van valamilyen csoportosító változó (faktor), $ g $ és egy folyamatos kovariát $ x $ , a y ~ x + g modell egy fő hatású ANCOVA modellhez illeszkedik, míg a y ~ x * g modell egy olyan modellhez, amely magában foglalja a kovariátussal való interakciót. A aov ugyanazokat a képleteket fogja használni.

Fordítson különös figyelmet a Note -re a aov.

Ami a + vs * -t illeti, a russellpierce nagyjából lefedi, de azt javasoljuk, hogy nézze meg a ?lm és a ?formula cikkeket, különös tekintettel a kézikönyv Bevezetés az R be, amely az R-hez tartozik (vagy megtalálhatja online, ha még nem találta ki, hogyan találja meg a számítógépén; a legkönnyebben ez magában foglalja a a “Súgó” legördülő menü az R vagy az RStudio alkalmazásban).

Megjegyzések

  • feltételezem, hogy két csoporttényezőm van: $ g_1, g_2 $ és két kovariáns $ x_1, x_2 $, a modellem $$ y_ {ij} = \ mu + \ alpha_i + \ eta_j + x_ {ij1} \ gamma_1 + x_ {ij2} \ gamma_2 + \ epsilon_ {ij} $$ Van y ~ g_1 + g_2 + x_1 + x_2 ugyanazt a trükköt végzi? Az x_1 és az x_2 értékkel kapott F értékek tesztelik a $ \ gamma_1 = 0 $ és $ \ gamma_2 = 0 $ rendszert?
  • Nem biztos abban, hogy ezt hogyan hagytam ki. Igen. …. és ha egyszerre akarja tesztelni mindkettőt, illessze be mind velük, mind nélkülük, és adja át a felszerelt lm objektumokat a anova címre (te ‘ Hamarosan megnézem, hogy rossz sorrendben adod-e meg nekik, mert néhány SS negatív lesz, ha ezt teszed)

Válasz

Azt javaslom, hogy olvassa el és olvassa el a Statisztikák felfedezése az R használatával Field szerint. Van egy szép szakasza az ANCOVA-ról.

Az ANCOVA futtatásához R-ben töltse be a következő csomagokat:

car compute.es effects ggplot2 multcomp pastecs WRS 

Ha a lm vagy aov (a aov -t használom) győződjön meg arról, hogy a kontrasztokat a “kontrasztok” segítségével állította be “függvény a aov vagy a lm végrehajtása előtt. R alapértelmezés szerint nem ortogonális kontrasztokat használ, amelyek mindent elrontanak egy ANCOVA-ban. Ha ortogonális kontrasztokat szeretne beállítani, használja:

contrasts(dataname$factorvariable)=contr.poly(# of levels, i.e. 3) 

majd futtassa a modellt

model.1=aov(dv~covariate+factorvariable, data=dataname) 

A modell megtekintéséhez használja:

Anova(model.1, type="III") 

Győződjön meg róla, hogy az “A” nagybetűt használja Anova, és nem anova. Ez eredményt ad a III típusú SS használatával.

summary.lm(model.1) újabb összefoglalót ad, és tartalmazza az R négyzetet. Kimenet.

posth=glht(model.1, linfct=mcp(factorvariable="Tukey")) ##gives the post-hoc Tukey analysis summary(posth) ##shows the output in a nice format. 

Ha tesztelni szeretné a regressziós lejtők homogenitását, akkor felvehet egy interakciós kifejezést is a IV-re és a kovariánsra. Ez a következő lenne:

model=aov(dv~covariate+IV+covariate:IV, data=dataname) 

Ha az interakció kifejezés jelentős, akkor nincs homogenitása.

Megjegyzések

  • Miért rontanak el mindent a nem ortogonális ellentétek?
  • A fenti kérdés megválaszolásához a ” miért nem rendes ortogonális kontrasztok rendetlenséget okoznak mindent fel “. A válasz az, hogy R alapértelmezés szerint nem ortogonális (azaz az átlagok közötti különbség), ami problémákat okozhat, ha külön-külön szeretné látni az egyes IV-ek hozzájárulását. Az ortogonális kontrasztok megadásakor elmondjuk R-nek, hogy azt akarjuk, hogy az IV ‘ s SS-k teljesen fel legyenek osztva és ne legyenek átfedésben. Ily módon tisztán és világosan láthatjuk az egyes prediktoroknak tulajdonított variációt. Ha nem adja meg, R alapértelmezés szerint a kontraszt liberálisabb megközelítését alkalmazza.
  • Miért érdekli a III típusú SS?

Válasz

Itt található egy kiegészítő dokumentáció http://goo.gl/yxUZ1R . Ezenkívül az a megfigyelésem, hogy amikor a kovariátum bináris, az összefoglaló (lm.object) használatával ugyanazt az IV becslést kapnánk, mint amit Anova generált (lm.object, type = “III”).

Megjegyzések

  • Ez nem ‘ nem egyértelmű, hogy állítólag ez válasz. Ez? Ha igen, kérjük, módosítsa a pontosítás érdekében. Ha kérdés, kérjük, tegye fel úgy, hogy rákattint a ASK QUESTION gombra a tetején &, és ott felteszi. Akkor segíteni tudunk Önnek megfelelően.
  • Egyetértett. Az üzenet az előzőre adott (kiegészítő) válaszként lett felülvizsgálva.

Válasz

Regressziót használunk elemzés olyan modellek létrehozására, amelyek leírják a prediktor változók variációjának hatását a válaszváltozóra. Néha, ha van egy kategorikus változónk, amelynek értéke olyan, mint Igen / Nem vagy Férfi / Nő stb., Az egyszerű regresszióanalízis több eredményt ad a kategorikus változó minden egyes értékéhez. Ilyen esetekben tanulmányozhatjuk a kategorikus változó hatását, ha azt a prediktor változóval együtt használjuk, és összehasonlítjuk a kategorikus változó egyes szintjeinek regressziós vonalait. Egy ilyen elemzést a kovariancia elemzésének neveznek, más néven ANCOVA-nak.

Példa
Vegye figyelembe a R beépített adatokat set mtcars. Megfigyeljük, hogy a am mező az átvitel típusát (automatikus vagy manuális) jelöli. Ez egy kategorikus változó, amelynek értéke 0 és 1. Az autó mérföldenkénti értéke (mpg) a ló teljesítményének értéke mellett (hp). Megvizsgáljuk a am értékének hatását a regresszióra mpg és hp között. A aov() függvény, majd a anova() függvény segítségével történik a többszörös regressziók összehasonlításához.

Bemeneti adatok
Hozzon létre egy adatkeretet, amely tartalmazza a mpg, hp és a mtcars adatkészletből. Itt a mpg -t választjuk válaszváltozóként, hp mint prediktív változót és am a kategorikus változó.

input <- mtcars[,c("am","mpg","hp")] head(input) 

Amikor a fenti kódot végrehajtjuk, a következő eredményt kapja:

 am mpg hp Mazda RX4 1 21.0 110 Mazda RX4 Wag 1 21.0 110 Datsun 710 1 22.8 93 Hornet 4 Drive 0 21.4 110 Hornet Sportabout 0 18.7 175 Valiant 0 18.1 105 

ANCOVA elemzés
Létrehozunk egy regressziós modellt, amely hp -t választja prediktív változónak, és mpg válaszváltozóként, figyelembe véve a am és az hp közötti interakciót.

A kategoriális változó és a prediktor változó

Regressziós modell létrehozása1

result1 <- aov(mpg~hp*am,data=mtcars) summary(result1) 

Amikor a fenti kódot végrehajtjuk, a következő eredményt kapja:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 77.391 1.50e-09 *** am 1 202.2 202.2 23.072 4.75e-05 *** hp:am 1 0.0 0.0 0.001 0.981 Residuals 28 245.4 8.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Ez az eredmény azt mutatja, hogy mind a ló teljesítményének, mind az átviteli típusnak jelentős hatása van a mérföld / gallonra, mivel a p-érték mindkét esetben kisebb, mint 0,05. De a két változó interakciója nem szignifikáns, mivel a p-érték meghaladja a 0,05 értéket.

Modell a kategorikus változó és a prediktor változó közötti interakció nélkül

A regressziós modell létrehozása2

result2 <- aov(mpg~hp+am,data=mtcars) summary(result2) 

Amikor a fenti kódot végrehajtjuk, a következő eredményt kapja:

 Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.4 678.4 80.15 7.63e-10 *** am 1 202.2 202.2 23.89 3.46e-05 *** Residuals 29 245.4 8.5 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Ez az eredmény azt mutatja, hogy mind a ló teljesítménye, mind a sebességváltó típusa jelentős hatással van az egy gallon mérföldre, mivel a p-érték mindkét esetben kevesebb, mint 0,05.

Két modell összehasonlítása
Most összehasonlíthatjuk a két modellt arra a következtetésre jutva, hogy a változók kölcsönhatása valóban jelentéktelen-e. Ehhez a anova() függvényt használjuk.

 anova(result1,result2) Model 1: mpg ~ hp * am Model 2: mpg ~ hp + am Res.Df RSS Df Sum of Sq F Pr(>F) 1 28 245.43 2 29 245.44 -1 -0.0052515 6e-04 0.9806 

Mivel a p-érték nagyobb, mint 0,05, arra a következtetésre jutunk, hogy a lóerő és az átviteli típus közötti kölcsönhatás nem jelentős. Tehát az egy literenkénti futásteljesítmény hasonló módon függ az autó lóerejétől mind az automatikus, mind a kézi sebességváltó módban.

Megjegyzések

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük