Wikipedia:
„Ve statistikách je pravděpodobnost chyb podle rodiny (FWER) pravděpodobnost provádění jednoho nebo více falešných objevů nebo chyb typu I mezi všemi hypotézami při provádění testů s více hypotézami. “
„ Míra falešných objevů (FDR) je jedním ze způsobů, jak konceptualizovat míru chyb typu I při testování nulové hypotézy při provádění více srovnání. „
Nerozumím rozdílu mezi těmito dvěma pojmy. Jak to neznamená totéž?
Možná mi můžete pomoci další zpracování následujícího příkladu:
Řekněte, že pravděpodobnost, že se nestranná mince podstatně odchýlí od distribuce hlavy / ocasu v poměru 50/50 v pořadí 1000 losování, je 0,001.
Pokud Chci zjistit, zda je jedna mince zaujatá, hodím ji 1000krát a pokud ukazuje hlavy ~ 500krát, mohu si být zcela jistá, že není zaujatá.
Pokud však hodím milion mincí 1000krát a považují ty zaujatosti sed, kteří neukazují 50/50 rozdělení hlav a ocasů, budu kategorizovat nezaujaté mince jako předpjaté, protože se znásobí pravděpodobnost, že se nezaujatá mince objeví odchylně od 50/50 rozdělení podle počtu mincí (1 milion).
Takže ze sady jednoho milionu nezaujatých mincí musím očekávat, že asi 1 000 000 * 0,001 = 1 000 mincí se podstatně odchýlí od 50% ocasu, 50% rozložení hlav.
Pokud jsem pochopil, jedná se o testování více hypotéz (synonymous: multiple comparisons?), Protože testuji hypotézu „coin is nezaujatý“ milionkrát a míra falešných objevů FDR je v tomto příkladu 1 000.
Jaká je tedy FWER (míra chyb v rodině)?
Komentáře
- Pomáhá to? stats.stackexchange.com/questions/59681/…
- Viz část fdr v stats.stackexchange.com/questions/166323/…
- @ChristophHanck co dělá $ m_0 $ (nebo $ m $ v tomto ohledu) znamená? (I ' m s odkazem na váš odkaz)
- Počet skutečných hypotéz.
- @ChristophHanck, takže $ m $ je počet všechny hypotézy?
Odpověď
Jedním z důvodů, proč jste zmateni, může být to, že uvažujete o zvláštním v případě, že jsou všechny nulové hypotézy pravdivé (tj. m = m0 ). Když jsou všechny nulové hypotézy pravdivé, jsou FWER a FDR skutečně stejné. Pro m nezávislé testy skutečných nulových hypotéz, FDR = FWER = 1- (1-alfa) ^ m .
Rozdíl nastane, když jsou některé nulové hypotézy pravdivé a jiné nulové hypotézy jsou nepravdivé. V takovém případě vám FDR řekne očekávaný podíl významných testů (nikoli všech testů), které budou chybami typu I. Výpočet FDR je pak ne tak jednoduché, protože to závisí na podílu nulových hypotéz, které jsou falešné, a také na moci (pravděpodobnosti významnosti pro testy falešných nulových hypotéz).
FWER ani FDR nikdy nemohou být větší než 1. Hodnota 1 000, kterou jste vypočítali, je jiná chybovost, která se nazývá chybová míra na rodinu: PFER = alpha * m.