Antag at vi kan vælge mellem to forskellige katalysatorer. 10 observationer er taget fra den første og 12 fra den anden. Hvis $ s_1 = 14 $ og $ s_2 = 28 $, kan vi på $ \ alpha = 5 \% $ afvise hypotesen om, at afvigelserne er ens?

Her er hvad læreren gjorde:

Forholdet er: $ s_1 / s_2 = 0,5. $

$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0,1538 $$

Så siger han: p-værdien er $ 2 \ gange \ min (0,1539; 0,8461) = 0,3074 $ og han afviser $ H_0 $.

Hvordan får jeg 0.1538?

Jeg tror, jeg kan tjekke en F-tabel for n = 9, m = 11, men hvad gør jeg så for at få sandsynligheden for, at denne værdi er $ \ le 0.5 $?

Kommentarer

  • Jeg fik en hel masse af tilsyneladende typografiske fejl. Tjek venligst spørgsmålet, og ret eventuelle misforståelser, jeg måtte have introduceret. Med de statistikker, du giver, bør $ H_0 $ ikke afvises.
  • Det afhænger af, hvor omfattende dine F-tabeller er, og hvordan de ' er arrangeret. Alternativt kan du bruge et program, der har cdf til F-distributionen indbygget. For eksempel giver R: pf(.5,9,11) svaret [1] 0.1537596
  • @ Glen_b, lad ' sige, at vi har F (.5,9,11). Hvad du siger er, at i en tabel som denne socr.ucla.edu/applets.dir/f_table.html antager jeg at finde den rigtige undertabel , og se derefter på n = 9 og m = 11 og få sandsynligheden derfra. Ret?
  • Hvad du har der er en tabel med kritiske værdier. Det giver kun halearealer op til 10%; du kan bruge egenskaberne for F til at finde lavere haleværdier, men den største ensidige p-værdi, du kan få fra det sæt tabeller, er 10%. Alt hvad du ' kan sige er " > 0.1 " i stedet for " = 0.1538 "
  • Ok. Lad ' s lade som om jeg laver en eksamen i morgen. Hvordan får jeg min P-værdi i et F-test spørgsmål uden en computer?

Svar

Den første ting at bemærke er, at da dette er en variansstest, kan du have Fer, der enten er store eller små, der er signifikante, mens F-tabeller ofte antager, at du laver ANOVA-beregninger (hvor kun store værdier af F kan forårsage afvisning).

Så du skal bruge det faktum, at den nedre hale af $ F (\ nu_1, \ nu_2) $ er den samme som den gensidige af den øverste hale af $ F (\ nu_2, \ nu_1 ) $.

Der er lidt mere diskussion af den her

Hvordan fortæller jeg, hvilken hale jeg er i? – Medianen for en F-fordeling i de tilfælde, du skal bekymre dig om for en varians test, vil være tæt på 1. Så hvis F-statistikken er mindre end 1, antager du at du har brug for den nederste hale. Hvis den er større end 1, skal du antage, at du har brug for den øverste hale.

I det numeriske eksempel i dit spørgsmål, F = 0,5 – du vil have en nedre hale til F.

Så for at finde det, er du nødt til at bytte frihedsgrader, og F-værdierne vil alle være de omvendte af dem, du har brug for. Da du har brug for området under 0,5, er det det samme som at finde området over 1 / 0.5 = 2 på en $ F_ {11,9} $.

Så du skal først bekymre dig om den højeste $ \ alpha $, du kan finde (0,1 i de angivne tabeller

Da de tabeller, du linkede, har df1 i kolonnerne, skal du finde 11-kolonnen og 9-rækken i dette tilfælde.

Du har ikke en 11, så lad os se på 10 og 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Så hvordan håndterer du det faktum, at der ikke er 11?

Nå skal du først bemærke, at så længe df2 er mindst 3 (og det vil være for en variansprøve i en eksamen), falder tabellen over kritiske værdier når enten df stiger

Så hvis vi bare fik en lavere grænse om p-værdien, skal du se på den næste nederste df (dvs. sammenligne med df1 = 10 i dette tilfælde).

[For mere nøjagtighed se dette indlæg om interpolering, der diskuterer interpolering i frihedsgrader for F mod slutningen. Hvis din test er truende, tvivler jeg på, at du har tid at lære noget mere end lineær interpolation dog. Det antyder lineær interpolation i den gensidige grad af frihedsgrader.]

Værdien ved df1 10, df2 = 9 er 2.41632 hvilket er større end din 2. Så du “er tættere på 1 end 0,1-værdien.

Hvilket betyder, at din lavere-t-p-værdi er> 0.1


Hvad hvis problemet lignede problemet i spørgsmålet, men F sagde $ 0,4 $ i stedet for $ 0,5 $?

1 / 0,4 = 2,5, hvilket betyder at den er længere ind i halen end de to ovenstående 0,10-værdier (2.41632, 2.37888). Så den nedre hale p < 0,10.

Sammenlign nu med 5% -værdierne. Vi ser det “er mindre end både 12,9 og 10,9 værdierne (som begge er lige over 3). Så den nederste hale p> 0,05. Så $ 0,05 < p < 0,10 $.

Hvad hvis problemet lignede problemet i spørgsmålet, men F var imellem værdierne for 10 og 12?

Lad os nu sige, at F-forholdet var 0,323.

Dette er mellem 0,05-værdien for 10,9 og 12,9 df – så er p < 0,05 eller> 0,05?

Mulighed 1: sig det er ca. 0,05.

Mulighed 2: er at sig, at det mindst skal være det næste mindre (p> 0,025)

Mulighed 3: bruge interpolation (men denne gang i signifikansniveauet, ikke df), som beskrevet på det interpolationslink, jeg tidligere har givet. Det antyder lineær interpolering i $ \ log \ alpha $.

Personligt, hvis jeg nogensinde var besat af at lave en F-test af afvigelser i praksis *, men alligevel på en eller anden måde ude af adgang til selv en lommeregner gøre en hurtig numerisk integration), ville jeg vælge mulighed 3. Hvis jeg ikke kunne gøre det af en eller anden grund, ville jeg vælge mulighed 1. Imidlertid kan forventningerne til den person, der markerer det, muligvis være mulighed 2.

* hvis jeg havde taget stærke hallucinogener eller havde lidt alvorligt hovedtraume eller en anden hændelse, der på en eller anden måde gjorde mig ikke længere i stand til at forstå, hvilken virkelig dårlig idé dette sandsynligvis ville være.

To halede p-værdier

Det ser ud til, at det er meningen, at du bare fordobler en halet p-værdi for at opnå to-halede.

Det er fint så vidt det går, så hold det bare, men for en diskussion af nogle af problemerne mere detaljeret, se diskussionen i eksemplet i slutningen af svaret her

[Kan tilføje nogle flere detaljer senere]

Svar

Først F statistik er ikke forholdet mellem std devs. Det er forholdet mellem afvigelser. Så F er 196/784 = 0,25. P-værdien ville så være 0,047.

Svar

Hvis du har brug for en p-værdi med to hale, kan du bruge:

$$ P- værdi = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

hvor:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *