FWER, FDR en meervoudige vergelijkingen voor beginners

Wikipedia:

“In statistieken is het family-wise error rate (FWER) de kans van het doen van een of meer valse ontdekkingen, of type I-fouten, onder alle hypothesen bij het uitvoeren van meerdere hypothesetests. “

” Het percentage valse ontdekkingen (FDR) is een manier om het aantal type I-fouten te conceptualiseren bij het testen van nulhypothesen bij het uitvoeren van meerdere vergelijkingen. “

Ik begrijp het verschil niet tussen deze twee concepten. Hoe bedoelen ze niet hetzelfde?

Misschien kun je me helpen door het volgende voorbeeld verder uitwerken:

Stel dat de kans dat een onbevooroordeelde munt substantieel afwijkt van een 50/50 kop / staart-verdeling in een reeks van 1.000 worpen 0,001 is.

Als Ik wil weten of één munt bevooroordeeld is, ik gooi hem 1000 keer en als hij ~ 500 keer hoofden laat zien, kan ik er vrij zeker van zijn dat hij niet bevooroordeeld is.

Maar als ik 1.000 keer gooi een miljoen munten en achten die bia sed wie geen 50/50-verdeling van kop en munt laat zien, zal onbevooroordeelde munten categoriseren als bevooroordeeld, omdat de kans dat een onbevooroordeelde munt afwijkt van de 50/50-verdeling wordt vermenigvuldigd door het aantal munten (1 miljoen).

Dus van een set van één miljoen onbevooroordeelde munten, moet ik verwachten dat ongeveer 1.000.000 * 0.001 = 1.000 munten substantieel zullen afwijken van de 50% munt, 50% kopverdeling.

Voor zover ik heb begrepen, is dit het testen van meerdere hypothesen (synoniem: meerdere vergelijkingen?), Aangezien ik de hypothese “munt is onbevooroordeeld” een miljoen keer test, en de foutieve ontdekkingssnelheid FDR is in dit voorbeeld 1.000.

Maar wat is dan de FWER (familiewijs foutenpercentage)?

Opmerkingen

Helpt dit? stats.stackexchange.com/questions/59681/…
Zie de fdr-sectie in stats.stackexchange.com/questions/166323/…
@ChristophHanck wat doet $ m_0 $ (of $ m $ trouwens) staan voor? (I ' m verwijzend naar uw link)
Het aantal echte hypothesen.
@ChristophHanck dus $ m $ is het aantal alle hypothesen?

Antwoord

Een deel van de reden waarom je in de war bent, kan zijn dat je overweegt de speciale het geval dat alle nulhypothesen waar zijn (dwz m = m0 ). Als alle nulhypothesen waar zijn, zijn de FWER en FDR inderdaad hetzelfde. Voor m onafhankelijke tests van echte nulhypothesen, FDR = FWER = 1- (1-alpha) ^ m .

Het verschil komt wanneer sommige nulhypothesen waar zijn en andere nul hypothesen zijn onjuist. In dat geval vertelt de FDR u het verwachte aandeel van significante tests (niet van alle tests) dat fouten van type I zullen zijn. Het berekenen van de FDR wordt dan niet zo eenvoudig, omdat het afhangt van de proportie nulhypothesen die onjuist zijn en ook van power (de waarschijnlijkheid van significantie voor de tests van de valse nulhypothesen).

Noch FWER noch FDR kunnen ooit groter zijn dan 1. De waarde van 1.000 die u heeft berekend, is een ander foutpercentage, het foutpercentage per familie genoemd: PFER = alpha * m.

Opmerkingen

Antwoord

Geef een reactie Antwoord annuleren