Estou usando o teste combinado de Fisher para fundir vários testes independentes diferentes. Tenho problemas para entender os resultados em alguns casos.
Exemplo: Digamos que eu execute dois testes diferentes, ambos com a hipótese de que mu é menor que 0. Digamos que n seja idêntico e as duas amostras têm a mesma variância calculada. No entanto, vamos supor que um teste produziu uma média de $ 1,5 $ e o outro é $ -1,5 $. Receberei dois valores-p complementares (por exemplo, $ 0,995 $ & $ 0,005 $). Curiosamente, a combinação dos dois resulta em um valor significativo de $ p $ no teste de Fisher: $ p = 0,0175 $.
Isso é estranho porque eu poderia ter escolhido o teste exatamente oposto $ (\ mu > 0) $ e resultados de amostra – e ainda obter $ p = 0,0175 $. É quase como se o teste de Fisher não levasse em consideração a direção da hipótese.
Alguém pode explicar isso?
Obrigado
Comentários
- Se eu interpretar esta pergunta corretamente, a discussão em Rice, Um teste de valor P combinado de consenso e a família A significância geral dos testes de componentes (Biometrics 1990) explica esse problema: consulte a página 304. O documento oferece uma solução.
- Na verdade, usando Fisher ' s teste de probabilidade combinada o p combinado para 0,995 e 0,005 é 0,03. Não que isso mude a interpretação (sorriso), mas estou me perguntando de onde veio o 0,0175.
- @AussieAndy Sim, eu concordo – faço cerca de 0,03136
Resposta
O teste de combinação de Fisher destina-se a combinar informações separadas testes feitos em conjuntos de dados independentes, a fim de obter energia quando os testes individuais podem não ter energia suficiente. O fato é que se as $ k $ hipóteses nulas estiverem todas corretas, o $ p $ -valor será uniforme distribuído em $ [0,1] $ independentemente um do outro. Isso significa que $ – 2 ∑ \ log (p_i) $ será $ \ chi ^ 2 $ com $ 2k $ graus de liberdade. Rejeitar essa hipótese nula combinada leva à conclusão de que pelo menos uma das hipóteses nulas é falsa. Isso é o que você está fazendo ao aplicar este procedimento.
Comentários
- Isso não parece resolver o problema real levantado pela pergunta: porque os dois valores p são simetricamente opostos e, portanto (pelo menos de acordo com alguma intuição) devem " cancelar, " como o método de Fisher ' s produz um " significativo " resultado – e qual conclusão ele apóia ??
- Isso deve ser $ 2k $ df.
- +1 para Rejeitar esta hipótese nula combinada leva à conclusão de que pelo menos uma das hipóteses nulas é falsa.
- Acho que o OP & no momento @whuber em seu comentários estão entendendo mal o significado da rejeição das hipóteses nulas combinadas. eric_kernfield está enfatizando isso ao repetir o que eu disse em minha resposta.
- @Michael, eu duvido que tenha entendido mal algo tão elementar quanto o que significa rejeitar as hipóteses combinadas. O que está faltando em sua resposta é uma explicação do aparente paradoxo levantado pelo OP e em meu comentário. Um lugar onde podemos buscar uma explicação é observar que em um caso os dados eram consistentes com o nulo e, no outro caso, eram notavelmente inconsistentes. O conjunto de dados combinado, portanto, ainda exibe alguma inconsistência com o nulo, que pode ser o motivo pelo qual o valor-p de Fisher é baixo – mas não tão baixo. Isso merece reflexão e estudo, em vez de lançar calúnias.
Resposta
Existem várias maneiras de combinar $ p $ -valores e alguns deles têm essa propriedade e outros não. Em parte, isso ocorre porque o problema não está bem especificado. Houve um extenso estudo de simulação de muitos dos métodos mais conhecidos. O ponto principal é que, se você deseja a propriedade de cancelamento, pode obtê-la, mas não é obrigada a fazê-lo.