Suponha que possamos escolher entre dois catalisadores diferentes. 10 observações são tiradas da primeira e 12 da outra. Se $ s_1 = 14 $ e $ s_2 = 28 $, podemos rejeitar em $ \ alpha = 5 \% $ a hipótese de que as variâncias são iguais?

Aqui está o que o professor fez:

A proporção é: $ s_1 / s_2 = 0,5. $

Então

$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0,1538 $$

Então ele diz: o valor p é $ 2 \ times \ min (0,1539; 0,8461) = 0,3074 $ e ele rejeita $ H_0 $.

Como faço para obter 0,1538?

Acho que posso verificar uma tabela F para n = 9, m = 11, mas o que eu faço então para obter a probabilidade de que esse valor seja $ \ le 0,5 $?

Comentários

  • Eu consertei muito de aparentes erros tipográficos. Verifique a pergunta e corrija quaisquer mal-entendidos que eu possa ter introduzido. Com as estatísticas que você fornece, $ H_0 $ não deve ser rejeitado.
  • Depende de quão extensas são suas tabelas F e como elas ' re organizado. Como alternativa, você pode usar um programa que tenha o cdf para a distribuição F embutido. Por exemplo, em R: pf(.5,9,11) dá a resposta [1] 0.1537596
  • @Glen_b, vamos ' s dizer que temos F (.5,9,11). O que você está dizendo é que em uma tabela como esta socr.ucla.edu/applets.dir/f_table.html , devo encontrar a subtabela adequada e, em seguida, observe n = 9 e m = 11 e obtenha a probabilidade a partir daí. Certo?
  • O que você tem aí é uma tabela de valores críticos. Ele fornece apenas áreas de cauda de até 10%; você pode usar as propriedades de F para encontrar os valores finais mais baixos, mas o maior valor p unilateral que você pode obter desse conjunto de tabelas será 10%. Tudo o que você ' d seria capaz de dizer é " > 0,1 " em vez de " = 0,1538 "
  • Ok. Vamos ' s fingir que vou fazer um exame sobre isso amanhã. Como vou obter meu valor P em uma pergunta do teste F, sem um computador?

Resposta

A primeira coisa a notar é que, uma vez que este é um teste de variância, você pode ter F “s que são grandes ou pequenos sendo significativos, enquanto que muitas vezes as tabelas F assumem que você está fazendo cálculos do tipo ANOVA (onde apenas grandes valores de F podem causar rejeição).

Portanto, você precisa aproveitar o fato de que a cauda inferior de $ F (\ nu_1, \ nu_2) $ é a mesma que o recíproco da cauda superior de $ F (\ nu_2, \ nu_1 ) $.

Há “um pouco mais de discussão sobre isso aqui

Como posso saber em que cauda estou? – A mediana de uma distribuição F nos casos com os quais você precisará se preocupar para um teste de variância seja próximo a 1. Portanto, se a estatística F for menor que 1, assuma que você precisa da cauda inferior. Se for maior que 1, suponha que você precise da cauda superior.

No exemplo numérico da sua pergunta, F = 0,5 – você quer uma cauda inferior para F.

Então, para descobrir isso, você precisa trocar os graus de liberdade, e os valores F serão todos os inversos dos que você precisa. Como você precisa da área abaixo de 0,5, é o mesmo que encontrar a área acima 1 / 0,5 = 2 em um $ F_ {11,9} $.

Então você precisa se preocupar primeiro com o $ \ alpha $ mais alto que você pode encontrar (0,1 nas tabelas indicadas ).

Visto que as tabelas vinculadas têm df1 nas colunas, você precisa encontrar a 11 coluna e a 9 linha neste caso.

Você não tem um 11, então vamos ver o 10 e o 12:

 ... 10 12 ⁞ 9 2.41632 2.37888 

Então, como você lida com o fato de que não há 11?

Bem, primeiro, observe que enquanto df2 for pelo menos 3 (e será para um teste de variância em um exame), a tabela de valores críticos diminui conforme o df aumenta

Então, se estamos apenas obtendo um limite inferior do valor p, olhe para o próximo df inferior (ou seja, compare com df1 = 10 neste caso).

[Para obter mais precisão, consulte esta postagem sobre interpolação, que discute a interpolação em graus de liberdade para o F no final. Se seu teste está se aproximando, duvido que você tenha tempo para aprender algo mais do que interpolação linear. Isso sugere interpolação linear no recíproco dos graus de liberdade.]

O valor em df1 10, df2 = 9 é 2,41632, que é maior do que 2. Então você “está mais próximo de 1 do que o valor de 0,1.

O que significa que seu valor p de cauda inferior é> 0,1


E se o problema fosse semelhante ao da pergunta, mas o F fosse $ 0,4 $ em vez de $ 0,5 $?

1 / 0,4 = 2,5, o que significa que está mais para dentro da cauda do que os dois valores 0,10 acima (2,41632, 2,37888). Portanto, a cauda inferior p < 0,10.

Agora compare com os valores de 5%. Vemos que é menor que os valores 12,9 e 10,9 (que estão um pouco acima de 3). Portanto, a cauda inferior p> 0,05. Portanto, $ 0,05 < p < 0,10 $.

E se o problema fosse semelhante ao da pergunta, mas o F fosse entre os valores para 10 e 12?

Agora, digamos que a proporção F foi de 0,323.

Isso está entre o valor de 0,05 para 10,9 e 12,9 df – então é p < 0,05 ou> 0,05?

Possibilidade 1: diga que é aproximadamente 0,05.

Possibilidade 2: é para diga que deve pelo menos o próximo menor (p> 0,025)

Possibilidade 3: usar interpolação (mas desta vez no nível de significância, não no df), conforme descrito no link de interpolação que dei antes. Isso sugere a interpolação linear em $ \ log \ alpha $.

Pessoalmente, se eu tivesse conseguido fazer um teste F de variâncias na prática *, mas de alguma forma incapaz de acessar até mesmo uma calculadora (com a qual fazer uma integração numérica rápida), eu escolheria a opção 3. Se eu não pudesse fazer isso por algum motivo, eu escolheria a opção 1. No entanto, as expectativas da pessoa que marcou pode muito bem ser a opção 2.

* se eu estivesse tomando alucinógenos poderosos, ou tivesse sofrido um traumatismo cranioencefálico grave, ou algum outro incidente que de alguma forma me tornasse incapaz de avaliar que ideia realmente ruim seria.


Valores p de duas caudas

Parece que a intenção é que você apenas duplique os valores-p de uma cauda para obter valores bicaudais.

Tudo bem no que diz respeito a isso, continue com isso, mas para uma discussão de alguns dos problemas em mais detalhes, consulte a discussão no exemplo no final da resposta aqui

[Pode-se adicionar mais detalhes posteriormente]

Resposta

Primeiro, o F estatística não é a proporção de devs padrão. É a razão das variâncias. Portanto, F é 196/784 = 0,25. O valor p seria então 0,047.

Resposta

Se precisar de um valor p bicaudal, você pode usar:

$$ P- valor = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$

onde:

$ F_0 = {S_1 ^ 2 \ sobre S_2 ^ 2} $

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *