FWER, FDR og flere sammenligninger for begyndere

Wikipedia:

“I statistikker er familiemæssig fejlrate (FWER) sandsynligheden at foretage en eller flere falske opdagelser eller type I-fejl blandt alle hypoteserne, når der udføres flere hypotesetest. “

” Den falske opdagelsesrate (FDR) er en måde at konceptualisere hastigheden af type I-fejl på i nulhypotesetest ved udførelse af flere sammenligninger. “

Jeg forstår ikke forskellen mellem disse to begreber. Hvordan betyder de ikke det samme?

Måske kan du hjælpe mig med yderligere uddybende følgende eksempel:

Sig sandsynligheden for, at en upartisk mønt i det væsentlige afviger fra en 50/50 hoved / halefordeling i en sekvens på 1.000 kast, er 0.001.

Hvis Jeg vil finde ud af, om en mønt er forudindtaget, kaster jeg den 1.000 gange, og hvis den viser hoveder ~ 500 gange, kan jeg være helt sikker på, at den ikke er partisk.

Men hvis jeg kaster en million mønter 1.000 gange og anser disse bia sed der ikke viser en 50/50-fordeling af hoveder og haler, vil jeg kategorisere upartiske mønter som forudindtaget, fordi sandsynligheden for, at en upartisk mønt, der afviger fra 50/50-fordelingen, er ganget efter antallet af mønter (1 million).

Således fra et sæt på en million upartiske mønter må jeg forvente, at omkring 1.000.000 * 0,001 = 1.000 mønter afviger væsentligt fra 50% haler, 50% hovedfordeling.

Så vidt jeg har forstået, er dette flere hypotesetest (synonymt: flere sammenligninger?), Da jeg tester hypotesen “mønt er upartisk” en million gange, og den falske opdagelsesrate FDR er 1.000 i dette eksempel.

Men hvad er så FWER (familiemæssig fejlfrekvens)?

Kommentarer

Hjælper dette? stats.stackexchange.com/questions/59681/…
Se afsnittet fdr i stats.stackexchange.com/questions/166323/…
@ChristophHanck hvad gør $ m_0 $ (eller $ m $ for den sags skyld) står for? (I ' henviser til dit link)
Antallet af sande hypoteser.
@ChristophHanck, så $ m $ er antallet af alle hypoteser?

Svar

En del af grunden til at du er forvirret kan være, at du overvejer specialet hvis alle nulhypoteser er sande (dvs. m = m0 ). Når alle nulhypoteser er sande, er FWER og FDR faktisk de samme. For m uafhængige tests af ægte nulhypoteser, FDR = FWER = 1- (1-alpha) ^ m .

Forskellen kommer, når nogle nulhypoteser er sande og nogle nul hypoteser er falske. I så fald fortæller FDR dig den forventede andel af signifikante tests (ikke af alle tests), der vil være type I. fejl. Beregning af FDR er derefter ikke så simpelt, fordi det afhænger af andelen af nulhypoteser, der er falske, og også af magt (sandsynligheden for betydning for testene af de falske nulhypoteser).

Hverken FWER eller FDR kan nogensinde være større end 1. Værdien af 1.000, som du har beregnet, er en anden fejlrate, der kaldes fejlfrekvensen pr. familie: PFER = alpha * m.

Kommentarer

Svar

Skriv et svar Annuller svar