Hur får man F-test p-värde | Complex Solutions

Antag att vi kan välja mellan två olika katalysatorer. 10 observationer är hämtade från den första och 12 från den andra. Om $ s_1 = 14 $ och $ s_2 = 28 $, kan vi vid $ \ alpha = 5 \% $ avvisa hypotesen att varianserna är lika?

Här är vad läraren gjorde:

Förhållandet är: $ s_1 / s_2 = 0.5. $

Sedan

$$ P (F_ {n = 9, m = 11} \ le 0.5) = 0,1538 $$

Sedan säger han: p-värdet är $ 2 \ gånger \ min (0,1539; 0,8461) = 0,3074 $ och han avvisar $ H_0 $.

Hur får jag 0.1538?

Jag tror att jag kan kontrollera en F-tabell för n = 9, m = 11, men vad ska jag göra för att få sannolikheten att detta värde är $ \ le 0,5 $?

Kommentarer

Jag fixade en hel del av uppenbara typografiska fel. Kontrollera frågan och korrigera eventuella missförstånd jag kan ha infört. Med den statistik du ger bör $ H_0 $ inte avvisas.
Det beror på hur omfattande dina F-tabeller är och hur de ' är ordnade. Alternativt kan du använda ett program som har cdf för F-distributionen inbyggd. Till exempel, i R: pf(.5,9,11) ger svaret [1] 0.1537596
@Glen_b, låt ' säger att vi har F (.5,9,11). Vad du säger är att i en tabell som den här socr.ucla.edu/applets.dir/f_table.html , antar jag att jag hittar rätt sub-tabell och titta sedan på n = 9 och m = 11 och få sannolikheten därifrån. Rätt?
Vad du har där är en tabell med kritiska värden. Det ger bara svansarealer upp till 10%; du kan använda egenskaperna för F för att hitta lägre svansvärden, men det största en-tailed p-värdet du kan få från den uppsättningen tabeller är 10%. Allt du ' kan säga är " > 0.1 " snarare än " = 0,1538 "
Ok. Låt ' s låtsas att jag gör en tentamen i morgon. Hur ska jag få mitt P-värde i en F-testfråga utan en dator?

Svar

Det första du bör lägga märke till är att eftersom detta är ett variansprov kan du ha F som är antingen stora eller små är betydande, medan F-tabeller ofta antar att du gör ANOVA-typberäkningar (där endast stora värden på F kan orsaka avslag).

Så du måste använda det faktum att den nedre svansen på $ F (\ nu_1, \ nu_2) $ är densamma som den ömsesidiga av den övre svansen på $ F (\ nu_2, \ nu_1 ) $.

Det finns lite mer diskussion om den här

Hur vet jag vilken svans jag befinner mig i? – Medianen för en F-fördelning i de fall du behöver oroa dig för ett variansprov kommer att vara nära 1. Så om F-statistiken är mindre än 1, antar att du behöver den nedre svansen. Om den är större än 1, antar att du behöver den övre svansen.

I det numeriska exemplet i din fråga, F = 0,5 – vill du ha en nedre svans för F.

Så för att hitta det måste du byta frihetsgrader, och F-värdena kommer alla att vara inverserna för dem du behöver. Eftersom du behöver området under 0,5 är det samma som att hitta området över 1 / 0.5 = 2 på en $ F_ {11,9} $.

Så du måste först oroa dig för de högsta $ \ alpha $ du kan hitta (0,1 i de angivna tabellerna

Eftersom tabellerna du länkar har df1 i kolumnerna måste du hitta 11-kolumnen och 9-raden i det här fallet.

Du har inte 11, så låt oss titta på 10 och 12:

 ... 10 12 ⁞ 9 2.41632 2.37888

Så hur hanterar du det faktum att det inte finns något 11?

Tja, först, lägg märke till att så länge df2 är minst 3 (och det kommer att vara för ett variansprov i en undersökning), minskar tabellen över kritiska värden när antingen df ökar

Så om vi bara fick en lägre gräns om p-värdet, titta på nästa nedre df (dvs. jämför med df1 = 10 i det här fallet).

[För mer noggrannhet se det här inlägget om interpolering, som diskuterar interpolering i frihetsgrader för F mot slutet. Om ditt test hotar tvivlar jag på att du har tid att lära sig något mer än linjär interpolering men. Det antyder linjär interpolering i det ömsesidiga av frihetsgraderna.]

Värdet vid df1 10, df2 = 9 är 2.41632 vilket är större än din 2. Så ”är närmare 1 än 0,1-värdet.

Vilket betyder att ditt p-värde med lägre svans är> 0,1

Vad händer om problemet liknar det i frågan men F var $ 0,4 $ istället för $ 0,5 $?

1 / 0,4 = 2,5 vilket betyder att det är längre in i svansen än de två 0,10 värdena ovan (2.41632, 2.37888). Så den nedre svansen p < 0,10.

Jämför nu med 5% -värdena. Vi ser att det är mindre än både 12,9 och 10,9 värdena (som båda är strax ovanför 3). Så den nedre svansen p> 0,05. Så $ 0,05 < p < 0,10 $.

Vad händer om problemet liknar det i frågan men F var emellan värdena för 10 och 12?

Låt oss nu säga att F-förhållandet var 0,323.

Detta ligger mellan 0,05-värdet för 10,9 och 12,9 df – så är p < 0,05 eller> 0,05?

Möjlighet 1: säg att det är ungefär 0,05.

Möjlighet 2: är att säg att det måste åtminstone nästa mindre (p> 0,025)

Möjlighet 3: använda interpolering (men den här gången i signifikansnivån, inte df), som beskrivs vid interpolationslänken jag gav tidigare. Det antyder linjär interpolering i $ \ log \ alpha $.

Personligen, om jag någonsin hade haft ett F-test av avvikelser i praktiken *, men ändå på något sätt inte kan komma åt ens en miniräknare (med vilken gör en snabb numerisk integration), jag skulle välja alternativ 3. Om jag inte kunde göra det av någon anledning skulle jag välja alternativ 1. Men förväntningarna hos den person som markerar det kan mycket väl vara alternativ 2.

* om jag hade tagit kraftfulla hallucinogener eller hade drabbats av allvarligt huvudskada eller någon annan incident som på något sätt gjorde att jag inte längre kunde uppskatta vilken riktigt dålig idé detta troligen skulle vara.

Två tailed p-värden

Det verkar som om det bara var dubbelt en-tailed p-värden för att få två-tailed.

Det är bra Så långt det går, så håll dig bara med det, men för en diskussion om några av frågorna mer detaljerat, se diskussionen i exemplet i slutet av svaret här

[Kan lägga till mer detaljer senare]

Svar

Först F statistik är inte förhållandet mellan std devs. Det är förhållandet mellan avvikelser. Så F är 196/784 = 0,25. P-värdet skulle då vara 0,047.

Svar

Om du behöver ett p-värde med två svansar kan du använda:

$$ P- värde = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

där:

$ F_0 = {S_1 ^ 2 \ över S_2 ^ 2} $

Kommentarer

Svar

Svar

Svar

Lämna ett svar Avbryt svar