Suponha que possamos escolher entre dois catalisadores diferentes. 10 observações são tiradas da primeira e 12 da outra. Se $ s_1 = 14 $ e $ s_2 = 28 $, podemos rejeitar em $ \ alpha = 5 \% $ a hipótese de que as variâncias são iguais?
Aqui está o que o professor fez:
A proporção é: $ s_1 / s_2 = 0,5. $
Então
$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0,1538 $$
Então ele diz: o valor p é $ 2 \ times \ min (0,1539; 0,8461) = 0,3074 $ e ele rejeita $ H_0 $.
Como faço para obter 0,1538?
Acho que posso verificar uma tabela F para n = 9, m = 11, mas o que eu faço então para obter a probabilidade de que esse valor seja $ \ le 0,5 $?
Comentários
Resposta
A primeira coisa a notar é que, uma vez que este é um teste de variância, você pode ter F “s que são grandes ou pequenos sendo significativos, enquanto que muitas vezes as tabelas F assumem que você está fazendo cálculos do tipo ANOVA (onde apenas grandes valores de F podem causar rejeição).
Portanto, você precisa aproveitar o fato de que a cauda inferior de $ F (\ nu_1, \ nu_2) $ é a mesma que o recíproco da cauda superior de $ F (\ nu_2, \ nu_1 ) $.
Há “um pouco mais de discussão sobre isso aqui
Como posso saber em que cauda estou? – A mediana de uma distribuição F nos casos com os quais você precisará se preocupar para um teste de variância seja próximo a 1. Portanto, se a estatística F for menor que 1, assuma que você precisa da cauda inferior. Se for maior que 1, suponha que você precise da cauda superior.
No exemplo numérico da sua pergunta, F = 0,5 – você quer uma cauda inferior para F.
Então, para descobrir isso, você precisa trocar os graus de liberdade, e os valores F serão todos os inversos dos que você precisa. Como você precisa da área abaixo de 0,5, é o mesmo que encontrar a área acima 1 / 0,5 = 2 em um $ F_ {11,9} $.
Então você precisa se preocupar primeiro com o $ \ alpha $ mais alto que você pode encontrar (0,1 nas tabelas indicadas ).
Visto que as tabelas vinculadas têm df1 nas colunas, você precisa encontrar a 11 coluna e a 9 linha neste caso.
Você não tem um 11, então vamos ver o 10 e o 12:
... 10 12 ⁞ 9 2.41632 2.37888
Então, como você lida com o fato de que não há 11?
Bem, primeiro, observe que enquanto df2 for pelo menos 3 (e será para um teste de variância em um exame), a tabela de valores críticos diminui conforme o df aumenta
Então, se estamos apenas obtendo um limite inferior do valor p, olhe para o próximo df inferior (ou seja, compare com df1 = 10 neste caso).
[Para obter mais precisão, consulte esta postagem sobre interpolação, que discute a interpolação em graus de liberdade para o F no final. Se seu teste está se aproximando, duvido que você tenha tempo para aprender algo mais do que interpolação linear. Isso sugere interpolação linear no recíproco dos graus de liberdade.]
O valor em df1 10, df2 = 9 é 2,41632, que é maior do que 2. Então você “está mais próximo de 1 do que o valor de 0,1.
O que significa que seu valor p de cauda inferior é> 0,1
E se o problema fosse semelhante ao da pergunta, mas o F fosse $ 0,4 $ em vez de $ 0,5 $?
1 / 0,4 = 2,5, o que significa que está mais para dentro da cauda do que os dois valores 0,10 acima (2,41632, 2,37888). Portanto, a cauda inferior p < 0,10.
Agora compare com os valores de 5%. Vemos que é menor que os valores 12,9 e 10,9 (que estão um pouco acima de 3). Portanto, a cauda inferior p> 0,05. Portanto, $ 0,05 < p < 0,10 $.
E se o problema fosse semelhante ao da pergunta, mas o F fosse entre os valores para 10 e 12?
Agora, digamos que a proporção F foi de 0,323.
Isso está entre o valor de 0,05 para 10,9 e 12,9 df – então é p < 0,05 ou> 0,05?
Possibilidade 1: diga que é aproximadamente 0,05.
Possibilidade 2: é para diga que deve pelo menos o próximo menor (p> 0,025)
Possibilidade 3: usar interpolação (mas desta vez no nível de significância, não no df), conforme descrito no link de interpolação que dei antes. Isso sugere a interpolação linear em $ \ log \ alpha $.
Pessoalmente, se eu tivesse conseguido fazer um teste F de variâncias na prática *, mas de alguma forma incapaz de acessar até mesmo uma calculadora (com a qual fazer uma integração numérica rápida), eu escolheria a opção 3. Se eu não pudesse fazer isso por algum motivo, eu escolheria a opção 1. No entanto, as expectativas da pessoa que marcou pode muito bem ser a opção 2.
* se eu estivesse tomando alucinógenos poderosos, ou tivesse sofrido um traumatismo cranioencefálico grave, ou algum outro incidente que de alguma forma me tornasse incapaz de avaliar que ideia realmente ruim seria.
Valores p de duas caudas
Parece que a intenção é que você apenas duplique os valores-p de uma cauda para obter valores bicaudais.
Tudo bem no que diz respeito a isso, continue com isso, mas para uma discussão de alguns dos problemas em mais detalhes, consulte a discussão no exemplo no final da resposta aqui
[Pode-se adicionar mais detalhes posteriormente]
Resposta
Primeiro, o F estatística não é a proporção de devs padrão. É a razão das variâncias. Portanto, F é 196/784 = 0,25. O valor p seria então 0,047.
Resposta
Se precisar de um valor p bicaudal, você pode usar:
$$ P- valor = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$
onde:
$ F_0 = {S_1 ^ 2 \ sobre S_2 ^ 2} $
pf(.5,9,11)
dá a resposta[1] 0.1537596