Jeg har et ganske enkelt spørsmål angående tolkningen av F-testen i Microsoft Excel.
La oss ikke si at dette er resultatene av F-testen min:
Jeg lurer nå på hvordan jeg skal tolke den for å velge riktig t-test (forutsatt like eller ulik avvik) for datasettet mitt.
Jeg har funnet guider som forteller meg om F kritisk> F, så bruk ulik avvik. Noen av veiledningene forteller deg imidlertid at du bare bruker p-verdien, så jeg er usikker på hvilke parametere jeg skal se på når du tolker resultatene.
Svar
Flere ting:
1) Når du gjør hypotesetester, er beslutningen den samme om du bruker p-verdier eller kritiske verdier (hvis det er ikke, du gjorde noe galt, eller i det minste inkonsekvent).
2) Når prøvestørrelsene er like, er t-testen (eller ANOVA) mindre følsom for forskjell avvik i avvik.
3) Du bør ikke gjøre en formell likhetstegnstest for å finne ut om du vil anta like avvik den resulterende prosedyren for testing av likhet med midler har ikke de egenskapene du sannsynligvis skulle ønske den hadde. Hvis du ikke er rimelig komfortabel med den samme variansforutsetningen, kan du ikke gjøre det (hvis du vil, anta at avvikene alltid er forskjellige med mindre du har noen grunn til å tro at de kommer til å være ganske nærme). T-testen (og ANOVA) -prosedyrer er ikke veldig følsomme for små til moderate forskjeller i populasjonsvarians, så med like (eller nesten like) utvalgstørrelser bør du være trygg når du er sikker på at de ikke er høy annerledes.
4) Den «vanlige» F-testen for likhetsvarians er ekstremt følsom for ikke-normalitet . Hvis du må teste likhetsvariansen, ville det ikke være mitt råd å bruke den testen.
Det vil si, hvis du kan gjøre en Welch-test eller lignende, kan det hende du har det bedre bare for å gjøre det. Det vil aldri koste deg mye, det kan spare mye. (I din spesielle situasjon i dette tilfellet er du sannsynligvis trygg nok uten det – men det er ingen spesiell grunn til ikke å gjøre det.)
Jeg vil være oppmerksom på at R som standard bruker Welch-testen når du prøver å gjøre en to-prøve t-test; det gjør bare versjonen av samme varians når du ber den om det. Jeg tror dette er den rette måten å gjøre det (å gjøre det tryggere som standard), om bare for å redde oss fra oss selv.
Kommentarer
- Takk for svaret ditt, Glen_b. I i.imgur.com/evP3NPh.jpg er F-kritikken imidlertid større enn F-verdien, noe som vil be meg om å bruke t-testen under forutsetning om ulik avvik, men p-verdien er større enn 0,05, noe som vil be meg om å bruke t-testen forutsatt like avvik. Dette er grunnen til at jeg er nysgjerrig på hvordan jeg skal tolke resultatene.
- Du ' tar feil. Å ha F mindre enn den kritiske verdien er ikke ' t, noe som tyder på at avvikene er mer forskjellige som kunne ha skjedd ved en tilfeldighet. Du har det nøyaktig bakover (kan du peke på guidene som sier det?). Derfor min tidligere kommentar: " avgjørelsen er den samme om du bruker p-verdier eller kritiske verdier (hvis det ikke er ' t, du gjorde noe galt …) ". Den direkte implikasjonen er at du hadde gjort noe galt. Men gitt mine andre kommentarer, er det '. Øvelsen er uansett en dårlig idé.
- Ikke noe problem, her er en av kildene: chemistry.depaul.edu/wwolbach/390_490/Excel / …
- Ok, jeg tror jeg udnerstand nå. Denne F-kritiske > F-tingen fungerer bare når p < 0,05, ellers kan vi si at prøvene har like avvik?
- Jeg tror du ikke ' ikke forstår det. Hvis $ F < F _ {\ mathrm {crit}} $ så automatisk $ p > 0,05 $. Tilsvarende, hvis $ F \ geq F _ {\ mathrm {crit}} $ så automatisk $ p \ leq 0,05 $. Alternativt, hvis $ p \ leq 0.05 $ så $ F \ geq F _ {\ mathrm {crit}} $ og hvis $ p > 0,05 $ så $ F < F _ {\ mathrm {crit}} $. Videre kan du under ingen omstendigheter si at de to populasjonene prøvene ble hentet fra, hadde like store avvik. Om prøvene i seg selv har like avvik, kan du fortelle bare ved å se på tallene – du trenger ikke ' ikke en test for det, men når de er forskjellige, trenger det ikke ' t fortelle deg mye interesse.
Svar
Hvis du vil vite mer om betydningen og beregningen av F-testen når den brukes som kriterium for variansanalyse (ANOVA) med eksempler i Excel, anbefaler jeg denne serien på fire artikler.Den endelige formelen er i stand til å ta hensyn til størrelsen på alfa, antall frihetsgrader for F-forholdets teller og nevner, og ikke-sentralitetsparameteren.
- Konseptet med statistisk kraft – http://www.informit.com/articles/article.aspx?p=2036566
- Den statistiske kraften til t-tester – http://www.informit.com/articles/article.aspx?p=2036565
- Parameteren for ikke-sentralitet i F-distribusjon – http://www.informit.com/articles/article.aspx?p=2036567
- Beregning av kraften til F-testen – http://www.informit.com/articles/article.aspx?p=2036568
Svar
Viktig: vær sikker på at variansen til variabel 1 er høyere enn variansen til variabel 2. Hvis ikke, bytt ut dataene dine. Som et resultat beregner Excel den riktige F-verdien, som er forholdet mellom varians 1 og varians 2 (F = Var1 / Var 2).
Konklusjon: hvis F> F Kritisk enhale avviser vi nullhypotesen avvik fra de to populasjonene er ulik.