Wikipedia:
”I statistiken är sannolikheten för familjefel (FWER) att göra en eller flera falska upptäckter, eller typ I-fel, bland alla hypoteser när man utför flera hypotesprov. ”
” Den falska upptäcktstakten (FDR) är ett sätt att konceptualisera hastigheten för typ I-fel vid nollhypotes-testning vid flera jämförelser. ”
Jag förstår inte skillnaden mellan dessa två begrepp. Hur betyder de inte samma sak?
Kanske kan du hjälpa mig med vidareutveckla följande exempel:
Anta att sannolikheten för att ett opartiskt mynt väsentligen avviker från en 50/50 huvud / svansfördelning i en sekvens av 1000 kast är 0,001.
Om Jag vill ta reda på om ett mynt är partiskt, jag kastar det 1000 gånger och om det visar huvuden ~ 500 gånger kan jag vara helt säker på att det inte är partiskt.
Men om jag kastar en miljon mynt 1000 gånger och anser dessa bia sed som inte visar en 50/50-fördelning av huvuden och svansar, jag kommer att kategorisera opartiska mynt som partiska, eftersom sannolikheten för att ett opartiskt mynt visar avvikande från 50/50-fördelningen multipliceras med antalet mynt (1 miljon).
Således, från en uppsättning på en miljon opartiska mynt, måste jag förvänta mig att cirka 1 000 000 * 0,001 = 1 000 mynt avviker väsentligt från 50% svansar, 50% huvuddistribution.
Så vitt jag förstår är detta flera hypoteser (synonymt: flera jämförelser?) När jag testar hypotesen ”myntet är opartiskt” en miljon gånger, och den falska upptäcktstakten FDR är 1000 i detta exempel.
Men vad är då FWER (familjefel)?
Kommentarer
- Hjälper det? stats.stackexchange.com/questions/59681/…
- Se avsnittet fdr i stats.stackexchange.com/questions/166323/…
- @ChristophHanck vad gör $ m_0 $ (eller $ m $ för den delen) står för? (Jag ' jag hänvisar till din länk)
- Antalet sanna hypoteser.
- @ChristophHanck så $ m $ är antalet alla hypoteser?
Svar
En del av anledningen till att du är förvirrad kan vara att du funderar på specialen om alla nollhypoteser är sanna (dvs. m = m0 ). När alla nollhypoteser är sanna är FWER och FDR verkligen samma. För m oberoende tester av sanna nollhypoteser, FDR = FWER = 1- (1-alfa) ^ m .
Skillnaden kommer när vissa nollhypoteser är sanna och andra noll hypoteser är falska. I så fall berättar FDR dig den förväntade andelen signifikanta tester (inte av alla tester) som kommer att vara typ I.-fel. Beräkningen av FDR är då inte så enkelt, eftersom det beror på andelen nollhypoteser som är falska och även på makt (sannolikheten för betydelse för testerna av de falska nollhypoteserna).
Varken FWER eller FDR kan någonsin vara större än 1. Värdet på 1000 som du beräknade är en annan felfrekvens som kallas felfrekvensen per familj: PFER = alfa * m.