Mám poměrně jednoduchou otázku týkající se interpretace F-testu v aplikaci Microsoft Excel.
Řekněme, že nejde o výsledky mého F-testu:
Nyní přemýšlím, jak jej interpretovat, abych vybral správný t-test (za předpokladu stejných nebo nerovných odchylek) pro můj soubor dat.
Našel jsem průvodce, který mi říká, jestli je F critical> F, pak používejte nerovnoměrné odchylky. Někteří průvodci vám ale říkají, abyste použili pouze hodnotu p, takže si nejsem jistý, na které parametry se při interpretaci výsledků dívat.
Odpovědět
Několik věcí:
1) Při provádění testů hypotéz je rozhodnutí stejné, ať už používáte hodnoty p nebo kritické hodnoty (pokud není to, udělali jste něco špatně nebo alespoň nekonzistentně).
2) Když jsou velikosti vzorků stejné, je t-test (nebo ANOVA) méně citlivý na rozdíly odchylky rozptylu.
3) Neměli byste provádět formální test rovnosti rozptylu, abyste zjistili, zda předpokládat stejné odchylky; výsledný postup testování rovnosti prostředků nemá takové vlastnosti, jaké byste si pravděpodobně přáli. Pokud „nejste dostatečně spokojeni s předpokladem stejné odchylky, nedělejte to (chcete-li, předpokládejte, že odchylky jsou vždy jiné, pokud nemáte nějaký důvod si myslet, že si budou docela blízké). T-test (a ANOVA) postupy nejsou „vysoce citlivé na malé až střední rozdíly v rozptylu populace, takže se stejnou (nebo téměř stejnou) velikostí vzorku byste měli být v bezpečí, kdykoli si budete„ jisti, že nejsou vysoce jiný.
4) „Obvyklý“ F-test pro rovnost rozptylu je extrémně citlivý na nenormálnost . Pokud musíte otestovat rovnost rozptylu, použití tohoto testu by nebylo mou radou.
Což znamená, že pokud jste schopni provést test typu Welch apod., Můžete být na tom lépe jen proto, abych to udělal. Nikdy vás to nebude stát moc, může to hodně ušetřit. (Ve vaší konkrétní situaci v tomto případě jste bez ní pravděpodobně dostatečně v bezpečí – ale není žádný zvláštní důvod to nedělat.)
Všimnu si, že R standardně používá Welchův test, když pokusíte se udělat dvouvýběrový t-test; verzi se stejnou odchylkou provede, pouze když jí to řeknete. Myslím, že je to správný způsob, jak to udělat (ve výchozím nastavení udělat bezpečnější věc), i když jen proto, abychom nás zachránili sami od sebe.
Komentáře
- Děkujeme za odpověď, Glen_b. V i.imgur.com/evP3NPh.jpg je však kritická hodnota F větší než hodnota F, což by mě vyzvalo k použití t-testu za předpokladu nerovné odchylky, ale hodnota p je větší než 0,05, což by mě vyzvalo k použití t-testu za předpokladu stejných odchylek. Proto jsem zvědavý, jak interpretovat výsledky.
- Jste ' omylem. Mít F menší než kritická hodnota není ' naznačující, že odchylky jsou více odlišné, k čemuž by mohlo dojít náhodou. Máte to přesně zpět (můžete ukázat na průvodce, kteří to říkají?). Proto můj dřívější komentář: " rozhodnutí je stejné, ať už použijete p-hodnoty nebo kritické hodnoty (pokud to není ' t, udělal jsi něco špatně …) ". Přímo z toho vyplývá, že jste udělali něco špatně. Ale vzhledem k mým dalším komentářům je to ' zcela diskutabilní. Cvičení je v každém případě špatný nápad.
- Žádný problém, tady je jeden ze zdrojů: chemistry.depaul.edu/wwolbach/390_490/Excel / …
- Dobře, myslím, že teď stojím. Tato F kritická > F věc funguje, jen když p < 0,05, jinak můžeme říci, že vzorky mají stejné odchylky?
- Myslím, že tomu nerozumíte '. Pokud $ F < F _ {\ mathrm {crit}} $, pak automaticky $ p > 0,05 $. Odpovídajícím způsobem, pokud $ F \ geq F _ {\ mathrm {krit}} $, pak automaticky $ p \ leq 0,05 $. Alternativně, pokud $ p \ leq 0,05 $, pak $ F \ geq F _ {\ mathrm {krit}} $ a pokud $ p > 0,05 $ pak $ F < F _ {\ mathrm {crit}} $. Dále za žádných okolností nelze říci, že dvě populace , ze kterých byly vzorky odebrány, mají stejné odchylky. Zda mají samy vzorky stejné odchylky, zjistíte pouhým pohledem na čísla – nepotřebujete ' test, ale když se liší, nepotřebuje ' Neřeknu vám mnoho zajímavostí.
Odpovědět
Pokud se chcete dozvědět více o významu a výpočtu F testu, pokud je použit jako kritérium pro analýzu rozptylu (ANOVA) s příklady v aplikaci Excel, doporučuji tuto sérii čtyř článků.Konečný vzorec je schopen zohlednit velikost alfa, počet stupňů volnosti pro čitatele a jmenovatele poměru F a parametr necentrality.
- Koncept statistické síly – http://www.informit.com/articles/article.aspx?p=2036566
- Statistická síla t-testů – http://www.informit.com/articles/article.aspx?p=2036565
- Parametr necentrality v distribuci F – http://www.informit.com/articles/article.aspx?p=2036567
- Výpočet síly F testu – http://www.informit.com/articles/article.aspx?p=2036568
Odpověď
Důležité: ujistěte se, že varianta proměnné 1 je vyšší než rozptyl proměnné 2. Pokud ne, vyměňte svá data. Výsledkem je, že Excel vypočítá správnou hodnotu F, což je poměr rozptylu 1 k rozptylu 2 (F = Var1 / Var 2).
Závěr: pokud F> F Kritický jednostranný ocas, odmítneme nulovou hypotézu. odchylky obou populací jsou nerovné.