Anta at vi kan velge mellom to forskjellige katalysatorer. 10 observasjoner er hentet fra den første og 12 fra den andre. Hvis $ s_1 = 14 $ og $ s_2 = 28 $, kan vi avvise hypotesen om at avvikene er like ved $ \ alpha = 5 \% $?

Dette er hva læreren gjorde:

Forholdet er: $ s_1 / s_2 = 0.5. $

Deretter

$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0,1538 $$

Så sier han: p-verdien er $ 2 \ ganger \ min (0,1539; 0,8461) = 0,3074 $ og han avviser $ H_0 $.

Hvordan får jeg 0.1538?

Jeg tror jeg kan sjekke en F-tabell for n = 9, m = 11, men hva gjør jeg da for å få sannsynligheten for at denne verdien er $ \ le 0.5 $?

Kommentarer

  • Jeg fikset mye av tilsynelatende typografiske feil. Vennligst sjekk spørsmålet og korriger eventuelle misforståelser jeg har innført. Med statistikken du gir, bør $ H_0 $ ikke avvises.
  • Det avhenger av hvor omfattende F-tabellene dine er og hvordan de ' er ordnet. Alternativt kan du bruke et program som har cdf for F-distribusjonen innebygd. For eksempel, i R: pf(.5,9,11) gir svaret [1] 0.1537596
  • @ Glen_b, la ' s si at vi har F (, 5,9,11). Det du sier er at i en tabell som denne socr.ucla.edu/applets.dir/f_table.html , antar jeg at jeg finner den riktige undertabellen , og så se på n = 9 og m = 11 og få sannsynligheten derfra. Ikke sant?
  • Det du har der er en tabell med kritiske verdier. Det gir bare halearealer opptil 10%; du kan bruke egenskapene til F for å finne lavere haleverdier, men den største ensidige p-verdien du kan få fra det settet med tabeller, vil være 10%. Alt du ' kan si er " > 0.1 " i stedet for " = 0.1538 "
  • Ok. La ' s late som jeg gjør en eksamen på det i morgen. Hvordan skal jeg få P-verdien min i et F-test spørsmål uten datamaskin?

Svar

Det første du må legge merke til er at siden dette er en variansprøve, kan du ha F «s som er enten store eller små som signifikante, mens F-tabeller ofte antar at du gjør ANOVA-beregninger (der bare store F-verdier kan forårsake avvisning).

Så du må benytte deg av det faktum at den nedre halen på $ F (\ nu_1, \ nu_2) $ er den samme som den gjensidige av den øvre halen på $ F (\ nu_2, \ nu_1 ) $.

Det er litt mer diskusjon om den her

Hvordan forteller jeg hvilken hale jeg er i? – Medianen for en F-fordeling i de tilfellene du trenger å bekymre deg for for en variansprøve være nær 1. Så hvis F-statistikken er mindre enn 1, antar du at du trenger den nedre halen. Hvis den er større enn 1, antar du at du trenger den øvre halen.

I det numeriske eksemplet i spørsmålet ditt, F = 0,5 – vil du ha en lavere hale for F.

Så for å finne det, må du bytte frihetsgrader, og F-verdiene vil alle være omvendt av de du trenger. Siden du trenger området under 0,5, er det det samme som å finne området over 1 / 0.5 = 2 på en $ F_ {11,9} $.

Så du må først bekymre deg for den høyeste $ \ alpha $ du kan finne (0,1 i de angitte tabellene

Siden tabellene du koblet har df1 på kolonnene, må du finne 11-kolonnen og 9-raden i dette tilfellet.

Du har ikke en 11, så la oss se på 10 og 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Så hvordan takler du det faktum at det ikke er 11?

Vel, legg merke til at så lenge df2 er minst 3 (og det vil være for en variansprøve i en eksamen), reduseres tabellen over kritiske verdier når enten df øker

Så hvis vi bare fikk en nedre grense om p-verdien, så se på den neste nedre df (dvs. sammenlign med df1 = 10 i dette tilfellet).

[For mer nøyaktighet se dette innlegget om interpolering, som diskuterer interpolering i frihetsgrader for F mot slutten. Hvis testen din er truende, tviler jeg på at du har tid å lære noe mer enn lineær interpolering skjønt. Det antyder lineær interpolasjon i gjensidighet av frihetsgrader.]

Verdien ved df1 10, df2 = 9 er 2.41632 som er større enn din 2. Så du «er nærmere 1 enn 0,1-verdien.

Hvilket betyr at din p-verdi med lavere haler er> 0.1


Hva om problemet var likt problemet i spørsmålet, men F var $ 0,4 $ i stedet for $ 0,5 $?

1 / 0,4 = 2,5, noe som betyr at den er lenger inn i halen enn de to 0,10-verdiene over (2.41632, 2.37888). Så den nedre halen p < 0.10.

Sammenlign nå med 5% -verdiene. Vi ser det er mindre enn både 12,9 og 10,9 verdiene (som begge er like over 3). Så den nedre halen p> 0,05. Så $ 0,05 < p < 0,10 $.

Hva om problemet var likt problemet i spørsmålet, men F var i mellom verdiene for 10 og 12?

La oss si at F-forholdet var 0,323.

Dette er mellom 0,05-verdien for 10,9 og 12,9 df – så er p < 0,05 eller> 0,05?

Mulighet 1: si at den er omtrent 0,05.

Mulighet 2: er å si at det i det minste må den neste mindre (p> 0.025)

Mulighet 3: bruke interpolasjon (men denne gangen i signifikansnivået, ikke df), som beskrevet på interpolasjonskoblingen jeg ga før. Det antyder lineær interpolering i $ \ log \ alpha $.

Personlig, hvis jeg noen gang hadde hatt en F-test av avvik i praksis *, men likevel ikke klarte å få tilgang til en kalkulator (som gjøre en rask numerisk integrasjon), ville jeg velge alternativ 3. Hvis jeg ikke kunne gjøre det av en eller annen grunn, ville jeg velge alternativ 1. Imidlertid kan forventningene til personen som markerer det, være alternativ 2.

* hvis jeg hadde tatt kraftige hallusinogener, eller hadde fått alvorlig hodetraume, eller en annen hendelse som på en eller annen måte gjorde meg ikke lenger i stand til å forstå hvilken virkelig dårlig ide dette sannsynligvis ville være.


To tailed p-verdier

Det ser ut til at det er meningen at du bare dobler en pik-verdier for å oppnå tospissede.

Det er greit så langt det går, så bare hold deg til det, men for en diskusjon av noen av problemene mer detaljert, se diskusjonen i eksemplet på slutten av svaret her

[Kan legge til litt mer detalj senere]

Svar

Først F statistikk er ikke forholdet mellom std devs. Det er forholdet mellom avvik. Så F er 196/784 = 0,25. P-verdien ville da være 0,047.

Svar

Hvis du trenger en p-verdi med to haler, kan du bruke:

$$ P- verdi = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

hvor:

$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *