Používám Fisherův kombinovaný test k fúzi několika různých nezávislých testů. V některých případech mám problém porozumět výsledkům.

Příklad: Řekněme, že spustím dva různé testy, oba s hypotézou, že mu je menší než 0. Řekněme, že n je identické a dva vzorky mají stejnou vypočítanou odchylku. Předpokládejme však, že jeden test přinesl průměr 1,5 $ a druhý $ -1,5 $. Dostanu dva doplňující se p-valy (např. 0,995 $ & $ 0,005 $). Je zajímavé, že kombinace těchto dvou způsobí v testu Fishera významnou hodnotu $ p $: $ p = 0,0175 $.

To je divné, protože jsem mohl zvolit přesně opačný test $ (\ mu > 0) $ a výsledky vzorkování – a přesto získáte $ p = 0,0175 $. Je to skoro jako kdyby Fisherův test nezohlednil směr hypotézy.

Může to někdo vysvětlit?

Díky

Komentáře

  • Pokud tuto otázku správně interpretuji, diskuse v Rice, Konsenzuální kombinovaný test P-hodnoty a rodina Celosvětová důležitost testů komponent (Biometrics 1990) vysvětluje tento problém: viz str. 304. Příspěvek nabízí řešení.
  • Vlastně pomocí Fisher ' s kombinovaným testem pravděpodobnosti je kombinované p pro 0,995 a 0,005 0,03. Ne že by to změnilo interpretaci (úsměv), ale zajímalo by mě, odkud 0,0175 pochází.
  • @AussieAndy Ano, já souhlasím – udělám to asi 0,03 136

odpověď

Test Fisherův kombinovaný test má za cíl spojit informace z jednotlivých testy prováděné na nezávislých souborech dat za účelem získání výkonu, když jednotlivé testy nemusí mít dostatečný výkon dea je, že pokud jsou $ k $ nulové hypotézy správné, bude $ p $ -value jednotně distribuováno na $ [0,1] $ nezávisle na sobě. To znamená, že $ – 2 ∑ \ log (p_i) $ bude $ \ chi ^ 2 $ s $ 2k $ stupňů volnosti. Odmítnutí této kombinované nulové hypotézy vede k závěru, že alespoň jedna z nulových hypotéz je nepravdivá. To je to, co děláte, když použijete tento postup.

Komentáře

  • Zdá se, že to neřeší skutečný problém vyvolaný otázkou: protože dvě p-hodnoty jsou symetricky opačné, a proto (alespoň podle určité intuice) by mělo být " zrušeno, " jak to, že metoda Fisher ' s vytváří " významnou " výsledek – a který závěr podporuje ??
  • To by mělo být $ 2k $ df.
  • +1 pro Odmítnutí této kombinované nulové hypotézy vede k závěru, že alespoň jedna z nulových hypotéz je nepravdivá.
  • Myslím, že OP & v té době @ whuber v jeho komentáře jsou nepochopením významu odmítnutí kombinovaných nulových hypotéz. eric_kernfield to zdůrazňuje opakováním toho, co jsem řekl ve své odpovědi.
  • @Michael, pochybuji, že jsem nesprávně pochopil něco tak elementárního, jako to, co znamená odmítnout kombinované hypotézy. Ve vaší odpovědi chybí vysvětlení zjevného paradoxu vyvolaného OP a v mém komentáři. Jedním z míst, kde bychom mohli hledat vysvětlení, je poznamenat, že v jednom případě byla data konzistentní s hodnotou null a ve druhém případě byla zjevně nekonzistentní. Kombinovaný datový soubor tak stále vykazuje určitý nesoulad s hodnotou null, což může být důvod, proč je Fisherova p-hodnota nízká – ale ne tak nízká. To si zaslouží zamyšlení a studium, spíše než vrhání aspirací.

Odpověď

Existuje několik způsobů, jak kombinovat $ p $ -hodnoty a některé z nich mají tuto vlastnost a některé nikoli. Je to částečně proto, že problém není dobře specifikován. Byla provedena rozsáhlá simulační studie mnoha nejznámějších metod. Závěrem je, že pokud chcete vlastnost zrušení, můžete ji mít, ale nemusíte.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *