Estou estudando Estatística para ciência de dados há alguns meses.

1) Estou aprendendo isso, quando temos que comparar vários amostras (> 2), então um teste T seria entediante e, em vez disso, vamos para ANOVA e conduzimos um “Teste F”.

2) O entendimento acima meio que cria um “requisito mutuamente exclusivo entre o teste F e o teste T”.

3) Eu também aprendi que, o teste T (seja: 1 amostra / emparelhada / 2 amostra) testa basicamente as diferenças nas médias, enquanto o “teste F” testa as diferenças nas variâncias.

4) Agora, suponha que dois grupos de amostras tenham médias quase iguais, mas variâncias muito diferentes, então , ambos os testes forneceriam respostas diferentes, certo?

O teste T diria “eles não são diferentes”. Mas o “teste F” diria “eles são diferentes”.

Ou mesmo para um caso reverso. (meios muito diferentes, mas quase as mesmas variâncias) ..

5) Então, com base no que (a média? ou a variância?), vamos finalmente decidir a verdadeira diferença?

6) Então a pergunta é: como eles estão relacionados? Se o objetivo original era descobrir que duas ou mais amostras são diferentes ou não, então como “procurando meios” (ou seja, escolhendo o teste T) para um número menor de grupos de amostra, é alterado para “procurando variâncias” quando nenhum dos grupos de amostra são> 2? (Quando o fato é: a variância e a média são basicamente características independentes de um grupo de amostra)

7) Essas duas métricas não deveriam ser verificadas para descobrir se realmente as duas amostras são diferentes ou não? >

(Mencionei os números de série para os pontos que mencionei. Saliente se algum deles é basicamente um entendimento errado. Agradeceria se fossem dadas respostas para cada ponto)

Comentários

  • O que você exatamente quer dizer com ” comparação de amostras “? Você está falando sobre comparar se a média da população que eles vêm é a mesma / diferente? Ou você está falando em verificar se a distribuição deles é a mesma / diferente?
  • Não tenho certeza !! Porque é isso que eu quero saber.! Não deveríamos procurar ambos para decidir ” se esses dois grupos de amostra são diferentes ou não ” em todos os aspectos? Não consegui encontrar nenhum tutorial que realçasse esta visualização .. A maioria dos tutoriais explica como ” … para comparar mais de dois grupos, vá para o teste F .. .. “. Dessa vez, o ponto de vista muda de ” olhando para a média ” para ” olhando para as variações !! ” .. Portanto, não estou certo disso!
  • Como um novo estudante de estatística, não sei o que procurar! .. a maioria dos tutoriais dizem .. ” Teste T OU teste F ” .. nenhum dos tutoriais disse ” verifique T e F !! (minha opinião: não deveríamos ‘ olhar de ambos os ângulos? (ou seja, os meios e também as variações)?
  • O link abaixo meio que vai para lá: Já referi. Mas não responde exatamente à minha pergunta): stats.stackexchange.com/questions/78150/…
  • Bem, fazer um ” teste ” é encontrar a resposta para uma pergunta. A primeira coisa que você precisa saber é qual é a pergunta real!

Resposta

Os termos teste t e o teste F são ambíguos, porque qualquer teste em que a estatística de teste tem uma distribuição t (sob a hipótese nula) é chamado de teste t e qualquer teste onde a estatística de teste tem uma distribuição F é chamado de teste F. Há mais de uma instância disso.

Isso é relevante para sua pergunta porque há um teste F que compara as variâncias de duas amostras, mas este não é o F -teste usado na análise ANOVA padrão. Na verdade, o teste F ANOVA compara a variabilidade entre os grupos e dentro dos grupos, e a variabilidade entre os grupos é, de fato, medida ao quadrar e somar as diferenças entre as médias dos grupos, portanto, nesta configuração, os testes t e F são sobre a comparação meios de grupo. Na verdade, se você tiver apenas dois grupos / níveis de fator, a estatística do teste F é o quadrado da estatística do teste t, e o teste F é equivalente ao teste t bilateral. Para mais de dois grupos, o problema com os testes t é que o teste t pode comparar apenas dois grupos ao mesmo tempo, o que significa que você precisará de vários testes t para comparar todos os grupos, envolvendo problemas com testes múltiplos (ou seja, se você teste várias hipóteses ao nível de 5%, a probabilidade de encontrar pelo menos uma significância errada assumindo que as hipóteses nulas são todas verdadeiras pode ser substancialmente superior a 5%).

Além disso, você está certo ao dizer que alguém pode estar interessado em explorar as diferenças entre médias e diferenças entre as variâncias, e grupos com a mesma média ainda podem ter variâncias diferentes. Você pode realmente verificar os dois, embora isso envolva vários testes; não há almoço grátis. Em muitas aplicações de ANOVA, é bastante razoável assumir variâncias iguais ou apenas diferenças médias são de interesse substancial (por exemplo, apenas se perguntando se um grupo tem desempenho “melhor” do que outro), portanto, diferenças nas variâncias muitas vezes não são investigados explicitamente (vou abster-me de uma declaração sobre se isso seria “bom” ou “correto”; ou melhor, minha resposta seria “depende” …).

Comentários

  • Obrigado pela explicação

Resposta

Se você estão comparando mais de dois grupos e estão interessados em comparar suas médias, então é comum fazer ANOVA conforme você diz, que testa a hipótese de que todas as médias do grupo são iguais. Fazendo múltiplos $ t $ -tests não é totalmente equivalente porque cada teste apenas verifica se as médias nesses dois grupos são iguais. Seu ponto 1)

O uso do $ Teste F $ para c A comparação de variâncias é usada porque o que você compara em ANOVA é a variação entre as médias do grupo versus a variação dentro dos grupos. (Seu ponto 3)

O restante de suas perguntas são difíceis de responder porque, veja meus pontos acima, acho que você tem alguns conceitos errados sobre o que está acontecendo.

Resposta

Considere esta fórmula

Ho: group1 and group2 has the same average (e.g. do they have the same average height) t = (mean-k)/(s/sqrt(n)), basic assumption. variance is known. Ho: Different level of fertilizer (NPK) has no significant effect on plants. F = n(mean-k)^2 / s^2, w/c is simply t^2 
  1. do ponto de vista da praticidade isso pode ser verdade correto.

2.Se você tem um grupo de controle e tratado formando a mesma população, então eles serão os mesmos. Mas digamos que se você tiver meninos e meninas, localização1 x localização2, eles podem ser diferentes.

  1. Correto.
  2. Possivelmente
  3. Dependendo do seu objetivo. Se você simplesmente deseja saber se o grupo tem características diferentes (como média), faça o teste t. Se você deseja saber se certos fatores aplicados (como diferentes níveis de nicotina do cigarro) têm efeitos significativos, use o teste F.
  4. A fórmula está relacionada, mas a aplicação difere dependendo do seu objetivo .

  5. Não. Uma vez que não faz sentido, já que o teste t e F têm objetivos ou problemas diferentes que estão resolvendo.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *