Jag har en ganska enkel fråga angående tolkningen av F-testet i Microsoft Excel.
Låt oss inte säga att det här är resultatet av mitt F-test:
Jag undrar nu hur man ska tolka det för att välja rätt t-test (förutsatt lika eller ojämna avvikelser) för min datamängd.
Jag har hittat guider som berättar om F kritisk> F, då använd ojämna avvikelser. Men några av guiderna säger att du bara ska använda p-värdet, så jag är osäker på vilka parametrar jag ska titta på när jag tolkar resultaten.
Svar
Flera saker:
1) När du gör hypotesprov är beslutet detsamma oavsett om du använder p-värden eller kritiska värden (om det är inte, du gjorde något fel, eller åtminstone inkonsekvent).
2) När provstorlekarna är lika är t-testet (eller ANOVA) mindre känsligt för skillnad skillnader i varians.
3) Du bör inte göra ett formellt likhetstest för att räkna ut om du ska anta lika varians eller inte; det resulterande förfarandet för testning av likvärdighet har inte de egenskaper som du troligen önskar. Om du inte är rimligt bekväm med antagandet om samma varians, gör det inte (om du vill, antar att avvikelserna alltid är olika om du inte har någon anledning att tro att de kommer att vara ganska nära). (och ANOVA) -förfaranden är inte mycket känsliga för små till måttliga skillnader i populationsvarians, så med lika (eller nästan lika) provstorlekar bör du vara säker när du är säker på att de inte är mycket annorlunda.
4) Det ”vanliga” F-testet för lika variation är extremt känsligt för icke-normalitet . Om du måste testa likhetsvariation, skulle det inte vara mitt råd att använda det testet.
Det vill säga om du kan göra ett Welch-test eller liknande kan du ha det bättre bara för att göra det. Det kommer aldrig att kosta dig mycket, det kan spara mycket. (I din speciella situation i det här fallet är du förmodligen säker nog utan det – men det finns ingen särskild anledning att inte göra det.)
Jag kommer att notera att R som standard använder Welch-testet när du försöker göra ett t-test med två prov; det gör bara versionen med samma varians när du berättar för det. Jag tror att det här är rätt sätt att göra det (att göra det säkrare som standard), om bara för att rädda oss från oss själva.
Kommentarer
- Tack för ditt svar, Glen_b. I i.imgur.com/evP3NPh.jpg är F-kritiken dock större än F-värdet, vilket skulle uppmana mig att använda t-testet förutsatt att det är ojämnt avvikelser, men p-värdet är större än 0,05, vilket skulle uppmana mig att använda t-testet förutsatt lika avvikelser. Det är därför jag är nyfiken på hur man ska tolka resultaten.
- Du ' tar fel. Att ha F mindre än det kritiska värdet är inte ' t vilket tyder på att avvikelserna är mer olika som kunde ha hänt av en slump. Du har det exakt bakåt (kan du peka på guiderna som säger det?). Därav min tidigare kommentar: " beslutet är detsamma oavsett om du använder p-värden eller kritiska värden (om det inte är ' t, du gjorde något fel …) ". Den direkta innebörden är att du hade gjort något fel. Men med tanke på mina andra kommentarer är det ' helt tufft. Övningen är i alla fall en dålig idé.
- Inget problem, här är en av källorna: chemistry.depaul.edu/wwolbach/390_490/Excel / …
- Okej, jag tror att jag förstår nu. Denna F-kritiska > F-sak fungerar bara när p < 0,05, annars kan vi säga att proverna har samma varians?
- Jag tror att du inte ' inte förstår det. Om $ F < F _ {\ mathrm {crit}} $ så automatiskt $ p > 0,05 $. På motsvarande sätt, om $ F \ geq F _ {\ mathrm {crit}} $ sedan automatiskt $ p \ leq 0,05 $. Alternativt, om $ p \ leq 0.05 $ då $ F \ geq F _ {\ mathrm {crit}} $ och om $ p > 0,05 $ då $ F < F _ {\ mathrm {crit}} $. Vidare kan du under inga omständigheter säga att de två populationerna proverna togs från har samma varians. Huruvida proverna själva har lika stora avvikelser kan du berätta bara genom att titta på siffrorna – du behöver inte ' för att testa det, men när de skiljer sig åt behöver det inte ' t berättar för dig mycket intresse.
Svar
Om du vill veta mer om betydelsen och beräkningen av F-testet när det används som ett kriterium för variansanalys (ANOVA) med exempel i Excel, rekommenderar jag denna serie av fyra artiklar.Den slutliga formeln kan ta hänsyn till storleken på alfa, antalet frihetsgrader för F-förhållandets täljare och nämnare och parametern för icke-centralitet.
- Begreppet statistisk kraft – http://www.informit.com/articles/article.aspx?p=2036566
- T-testens statistiska kraft – http://www.informit.com/articles/article.aspx?p=2036565
- Parametern för icke-centralitet i F-distributionen – http://www.informit.com/articles/article.aspx?p=2036567
- Beräkna F-testets kraft – http://www.informit.com/articles/article.aspx?p=2036568
Svar
Viktigt: se till att variansen för variabel 1 är högre än variansen för variabel 2. Om inte, byt ut dina data. Som ett resultat beräknar Excel rätt F-värde, vilket är förhållandet mellan Varians 1 och Varians 2 (F = Var1 / Var 2).