Wikipedia:

«I statistikk er familiemessig feilrate (FWER) sannsynligheten å gjøre en eller flere falske funn, eller type I-feil, blant alle hypotesene når du utfører flere hypotesetester. «

» Den falske oppdagelsesfrekvensen (FDR) er en måte å konseptualisere frekvensen av type I-feil på i nullhypotesetesting når vi gjennomfører flere sammenligninger. «

Jeg forstår ikke forskjellen mellom disse to begrepene. Hvordan betyr de ikke det samme?

Kanskje du kan hjelpe meg ved å videre utdyper følgende eksempel:

Si sannsynligheten for at en objektiv mynt i vesentlig grad avviker fra en 50/50 hode / halefordeling i en sekvens på 1000 kast, er 0,001.

Hvis Jeg vil finne ut om en mynt er partisk, jeg kaster den 1000 ganger, og hvis den viser hoder ~ 500 ganger, kan jeg være ganske sikker på at den ikke er partisk.

Men hvis jeg kaster en million mynter 1000 ganger og anser de som bia sed som ikke viser en 50/50-fordeling av hoder og haler, vil jeg kategorisere objektive mynter som forutinntatt, fordi sannsynligheten for at en upartisk mynt som avviker fra 50/50-fordelingen er multiplisert etter antall mynter (1 million).

Således, fra et sett med en million upartiske mynter, må jeg forvente at rundt 1.000.000 * 0.001 = 1.000 mynter vil avvike vesentlig fra 50% haler, 50% hodefordeling.

Så vidt jeg forsto er dette flere hypotesetester (synonymt: flere sammenligninger?) Når jeg tester hypotesen «mynt er upartisk» en million ganger, og den falske oppdagelsesgraden FDR er 1000 i dette eksemplet.

Men hva er så FWER (familiemessig feilrate)?

Kommentarer

Svar

En del av årsaken til at du er forvirret kan være at du vurderer spesialen tilfelle at alle nullhypoteser er sanne (dvs. m = m0 ). Når alle nullhypoteser er sanne, er FWER og FDR faktisk de samme. For m uavhengige tester av sanne nullhypoteser, FDR = FWER = 1- (1-alfa) ^ m .

Forskjellen kommer når noen nullhypoteser er sanne og noen null hypoteser er falske. I så fall forteller FDR deg den forventede andelen signifikante tester (ikke av alle tester) som vil være type I. feil. Å beregne FDR er da ikke så enkelt, fordi det avhenger av andelen nullhypoteser som er falske og også av kraft (sannsynlighetene for betydning for testene av de falske nullhypotesene).

Verken FWER eller FDR kan noen gang være større enn 1. Verdien på 1000 som du beregnet er en annen feilrate som kalles feilrate per familie: PFER = alfa * m.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *