Jeg har et ret simpelt spørgsmål angående fortolkningen af F-testen i Microsoft Excel.
Lad os ikke sige, det er resultaterne af min F-test:
Jeg spekulerer nu på, hvordan man fortolker det for at vælge den korrekte t-test (forudsat at der er lige eller ulige afvigelser) til mit datasæt.
Jeg har fundet guider, der fortæller mig, om F kritisk> F, så Brug ulige afvigelser. Nogle af vejledningerne fortæller dig dog kun at bruge p-værdien, så jeg er usikker på, hvilke parametre jeg skal se på, når vi fortolker resultaterne.
Svar
Flere ting:
1) Når du laver hypotesetest, er beslutningen den samme, uanset om du bruger p-værdier eller kritiske værdier (hvis det er ikke, du gjorde noget forkert eller i det mindste inkonsekvent).
2) Når prøvestørrelser er ens, er t-testen (eller ANOVA) mindre følsom over for forskellige afvigelser i varians.
3) Du bør ikke lave en formel varighedstest for at finde ud af, om du skal antage lige afvigelser eller ej; den resulterende procedure til afprøvning af lighed mellem midler har ikke de egenskaber, du sandsynligvis ville ønske, den havde. Hvis du ikke er rimelig komfortabel med den samme variansantagelse, skal du ikke gøre det (hvis du vil, antag, at afvigelserne altid er forskellige, medmindre du har en eller anden grund til at tro, at de kommer til at være temmelig tæt). T-testen (og ANOVA) -procedurer er ikke meget følsomme over for små til moderate forskelle i populationsvarians, så med lige (eller næsten ens) stikprøvestørrelser skal du være sikker, når du er sikker på, at de ikke er meget anderledes.
4) Den “sædvanlige” F-test for lighed med varians er ekstremt følsom over for ikke-normalitet . Hvis du skal teste lighed for varians, ville det ikke være mit råd at bruge denne test.
Hvilket vil sige, hvis du “er i stand til at lave en Welch-type test eller lignende, kan du have det bedre bare for at gøre det. Det koster dig aldrig meget, det kan spare meget. (I din særlige situation i dette tilfælde er du sandsynligvis sikker nok uden det – men der er ingen særlig grund til ikke at gøre det.)
Jeg vil bemærke, at R som standard bruger Welch-testen, når du prøver at lave en to-prøve t-test; det gør kun versionen med samme varians, når du fortæller det til. Jeg tror, det er den rigtige måde at gøre det (at gøre det sikrere som standard), hvis kun for at redde os fra os selv.
Kommentarer
- Tak for dit svar, Glen_b. I i.imgur.com/evP3NPh.jpg er F-kritikken dog større end F-værdien, hvilket vil bede mig om at bruge t-testen under forudsætning af ulige afvigelser, men p-værdien er større end 0,05, hvilket vil bede mig om at bruge t-testen under forudsætning af lige afvigelser. Det er derfor, jeg er nysgerrig efter, hvordan resultaterne skal fortolkes.
- Du ' tager fejl. At have F mindre end den kritiske værdi er ikke ' t, hvilket tyder på, at afvigelserne er mere forskellige, og der kunne være sket tilfældigt. Du har det nøjagtigt bagud (kan du pege på de guider, der siger det?). Derfor er min tidligere kommentar: " beslutningen er den samme, uanset om du bruger p-værdier eller kritiske værdier (hvis det ikke er ' t, du gjorde noget forkert …) ". Den direkte implikation er, at du havde gjort noget forkert. Men i betragtning af mine andre kommentarer er det ' fuldstændig skidt. Øvelsen er under alle omstændigheder en dårlig idé.
- Intet problem, her er en af kilderne: chemistry.depaul.edu/wwolbach/390_490/Excel / …
- Ok, jeg tror jeg udnerstand nu. Denne F-kritiske > F-ting fungerer kun, når p < 0,05, ellers kan vi sige, at prøverne har lige store afvigelser?
- Jeg tror, du ikke ' ikke forstår det. Hvis $ F < F _ {\ mathrm {crit}} $, så automatisk $ p > 0,05 $. Tilsvarende, hvis $ F \ geq F _ {\ mathrm {crit}} $ derefter automatisk $ p \ leq 0,05 $. Alternativt, hvis $ p \ leq 0,05 $ derefter $ F \ geq F _ {\ mathrm {crit}} $ og hvis $ p > 0,05 $ derefter $ F < F _ {\ mathrm {crit}} $. Desuden kan du under ingen omstændigheder sige, at de to populationer prøverne blev trukket fra, har lige store afvigelser. Om prøverne selv har lige store afvigelser, kan du fortælle bare ved at se på tallene – du behøver ' ikke brug for en test for det, men når de adskiller sig, er det ikke ' fortæller dig ikke meget af interesse.
Svar
Hvis du vil vide mere om betydningen og beregningen af F-testen, når den bruges som kriterium for variansanalysen (ANOVA) med eksempler i Excel, anbefaler jeg denne serie med fire artikler.Den endelige formel er i stand til at tage højde for størrelsen af alfa, antallet af frihedsgrader for F-forholdets tæller og nævneren og ikke-centralitetsparameteren.
- Begrebet statistisk magt – http://www.informit.com/articles/article.aspx?p=2036566
- Den statistiske kraft ved t-tests – http://www.informit.com/articles/article.aspx?p=2036565
- Parameteren for ikke-centralitet i F-distributionen – http://www.informit.com/articles/article.aspx?p=2036567
- Beregning af F-testens styrke – http://www.informit.com/articles/article.aspx?p=2036568
Svar
Vigtigt: Sørg for, at variansen for variabel 1 er højere end variansen for variabel 2. Hvis ikke, skal du bytte dine data. Som et resultat beregner Excel den korrekte F-værdi, som er forholdet mellem Varians 1 og Varians 2 (F = Var1 / Var 2).
Konklusion: Hvis F> F kritisk enhale, afviser vi nulhypotesen afvigelser fra de to populationer er ulige.