Załóżmy, że możemy wybrać jeden z dwóch różnych katalizatorów. 10 obserwacji pochodzi z pierwszej, a 12 z drugiej. Jeśli $ s_1 = 14 $ i $ s_2 = 28 $, czy możemy odrzucić przy $ \ alpha = 5 \% $ hipotezę, że wariancje są równe?
Oto co zrobił nauczyciel:
Stosunek wynosi: $ s_1 / s_2 = 0,5. $
Następnie
$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0,1538 $$
Następnie mówi: wartość p wynosi 2 $ \ times \ min (0,1539; 0,8461) = 0,3074 $ i odrzuca $ H_0 $.
Jak uzyskać wynik 0.1538?
Myślę, że mogę sprawdzić tabelę F dla n = 9, m = 11, ale co mam wtedy zrobić, aby uzyskać prawdopodobieństwo, że ta wartość wynosi $ \ le 0,5 $?
Komentarze
Odpowiedź
Pierwszą rzeczą, na którą należy zwrócić uwagę, jest to, że ponieważ jest to test wariancji, możesz mieć F „, które są albo duże, albo małe i są znaczące, podczas gdy często tabele F zakładają, że wykonujesz obliczenia typu ANOVA (gdzie tylko duże wartości F mogą spowodować odrzucenie).
Więc musisz skorzystać z faktu, że dolny koniec $ F (\ nu_1, \ nu_2) $ jest taki sam jak odwrotność górnego końca $ F (\ nu_2, \ nu_1 ) $.
Jest trochę więcej dyskusji na ten temat tutaj
Jak sprawdzić, na którym ogonie jestem? – Mediana rozkładu F w przypadkach, o które będziesz musiał się martwić, aby wykonać test wariancji, będzie być blisko 1. Więc jeśli statystyka F jest mniejsza niż 1, załóżmy, że potrzebujesz dolnego ogona. Jeśli jest większy niż 1, załóżmy, że potrzebujesz górnego ogona.
W liczbowym przykładzie twojego pytania, F = 0,5 – chcesz dolnego ogona dla F.
Aby to znaleźć, musisz zamienić stopnie swobody, a wszystkie wartości F będą odwrotnością tych, których potrzebujesz. Ponieważ potrzebujesz obszaru poniżej 0,5, jest to to samo, co znalezienie pola powyżej 1 / 0,5 = 2 na $ F_ {11,9} $.
Więc najpierw musisz się martwić o najwyższe $ \ alpha $, jakie możesz znaleźć (0,1 we wskazanych tabelach ).
Ponieważ połączone tabele mają w kolumnach df1, w tym przypadku musisz znaleźć kolumnę 11 i wiersz 9.
Nie masz 11, więc spójrzmy na 10 i 12:
... 10 12 ⁞ 9 2.41632 2.37888
Więc jak sobie radzisz fakt, że nie ma 11?
Cóż, po pierwsze, zauważ, że dopóki df2 wynosi co najmniej 3 (i będzie to dla testu wariancji na egzaminie), tabela wartości krytycznych maleje gdy rośnie albo df
Więc jeśli otrzymujemy tylko dolną granicę wartości p, spójrz na następną niższą wartość df (tj. porównaj z df1 = 10 w tym przypadku).
[Aby uzyskać większą dokładność, zobacz ten post na temat interpolacji, w którym omówiono interpolację w stopniach swobody dla F. Pod koniec testu. Jeśli zbliża się twój test, wątpię, czy masz czas nauczyć się czegoś więcej niż interpolacji liniowej. To sugeruje interpolację liniową w odwrotności stopni swobody.]
Wartość w df1 10, df2 = 9 to 2,41632, czyli większe niż 2. Więc „bliżej 1 niż wartość 0,1.
Co oznacza, że twoja wartość p z niższymi ogonami wynosi> 0,1
Co by było, gdyby problem był podobny do tego w pytaniu, ale F brzmiało 0,4 $ zamiast 0,5 $?
1 / 0,4 = 2,5, co oznacza, że znajduje się dalej w ogonie niż dwie powyższe wartości 0,10 (2,41632, 2,37888). A więc p < 0,10.
Teraz porównaj z 5% wartościami. Widzimy, że jest to mniej niż wartości 12,9 i 10,9 (obie są nieco powyżej 3). Zatem dolny koniec p> 0,05. Więc 0,05 USD < p < 0,10 $.
A jeśli problem był podobny do tego w pytaniu, ale F było pomiędzy wartości dla 10 i 12?
Teraz powiedzmy, że współczynnik F wynosił 0,323.
Jest to między wartością 0,05 dla 10,9 a 12,9 df – więc jest p < 0,05 lub> 0,05?
Możliwość 1: powiedz, że to około 0,05.
Możliwość 2: jest powiedzieć, że musi przynajmniej następną mniejszą (p> 0,025)
Możliwość 3: użyj interpolacji (ale tym razem na poziomie istotności, a nie df), jak opisano w linku interpolacyjnym, który podałem wcześniej. To sugeruje liniową interpolację w $ \ log \ alpha $.
Osobiście, gdybym kiedykolwiek był w stanie wykonać test F wariancji w praktyce *, ale w jakiś sposób nie mogłem uzyskać dostępu nawet do kalkulatora (za pomocą którego zrobić szybką całkowanie numeryczne), wybrałbym opcję 3. Gdybym z jakiegoś powodu nie mógł tego zrobić, wybrałbym opcję 1. Jednak oczekiwania osoby oznaczającej ją równie dobrze mogą być opcją 2.
* gdybym zażywał silne halucynogeny, doznał poważnego urazu głowy lub jakiegoś innego incydentu, który w jakiś sposób sprawił, że nie byłbym w stanie docenić tego, jaki byłby to naprawdę zły pomysł.
Dwustronne wartości p
Wydaje się, że zamierzeniem jest podwojenie jednostronnych wartości p, aby uzyskać dwustronne.
W porządku jeśli chodzi o to, po prostu trzymaj się tego, ale aby uzyskać bardziej szczegółowe omówienie niektórych problemów, zobacz dyskusję w przykładzie na końcu odpowiedzi tutaj
[Później można dodać więcej szczegółów]
Odpowiedź
Po pierwsze, F statystyka nie jest stosunkiem std devs. Jest to stosunek wariancji. Zatem F wynosi 196/784 = 0,25. Wartość p wyniosłaby wówczas 0,047.
Odpowiedź
Jeśli potrzebujesz wartości p z dwóch ogonów, możesz użyć:
$$ P- value = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$
gdzie:
$ F_0 = {S_1 ^ 2 \ ponad S_2 ^ 2} $
pf(.5,9,11)
podaje odpowiedź[1] 0.1537596