Wikipedia:
„În statistici, rata de eroare în funcție de familie (FWER) este probabilitatea de a face una sau mai multe descoperiri false sau erori de tip I, printre toate ipotezele atunci când se efectuează teste de ipoteze multiple. „
” Rata de descoperire falsă (FDR) este o modalitate de conceptualizare a ratei erorilor de tip I în testarea nulă a ipotezelor atunci când efectuez comparații multiple. „
Nu înțeleg diferența dintre aceste două concepte. Cum nu înseamnă același lucru?
Poate mă puteți ajuta prin elaborând în continuare următorul exemplu:
Spuneți că probabilitatea ca o monedă imparțială să se abată substanțial de la o distribuție de 50/50 cap / coadă într-o secvență de 1.000 de aruncări este de 0,001.
Dacă Vreau să aflu dacă o monedă este părtinitoare, o arunc de 1.000 de ori și dacă arată capete de 500 de ori pot fi sigur că nu este părtinitoare.
Cu toate acestea, dacă arunc un milion de monede de 1.000 de ori și considera acele bia dar care nu prezintă o distribuție 50/50 a capetelor și cozilor, voi voi clasifica monedele imparțiale ca fiind părtinitoare, deoarece probabilitatea ca o monedă imparțială să se abată de la distribuția 50/50 este multiplicată după numărul de monede (1 milion).
Astfel, dintr-un set de un milion de monede imparțiale, trebuie să mă aștept ca aproximativ 1.000.000 * 0.001 = 1.000 de monede să devieze în mod substanțial de la 50% cozi, 50% distribuție capete.
Din câte am înțeles, acesta este testarea ipotezelor multiple (sinonim: comparații multiple?), Deoarece testez ipoteza „moneda este imparțială” de un milion de ori, iar rata de descoperire falsă FDR este de 1.000 în acest exemplu.
Dar ce este, deci, FWER (rata de eroare a familiei)?
Comentarii
- Ajută acest lucru? stats.stackexchange.com/questions/59681/…
- Consultați secțiunea fdr din stats.stackexchange.com/questions/166323/…
- @ChristophHanck ce înseamnă $ m_0 $ (sau $ m $ pentru asta) reprezintă? (M ' mă refer la linkul dvs.)
- Numărul ipotezelor adevărate.
- @ChristophHanck deci $ m $ este numărul de toate ipotezele?
Răspuns
O parte din motivul pentru care sunteți confuz poate fi că luați în considerare specialul caz că toate ipotezele nule sunt adevărate (adică m = m0 ). Când toate ipotezele nule sunt adevărate, FWER și FDR sunt într-adevăr aceleași. Pentru m teste independente ale ipotezelor nule adevărate, FDR = FWER = 1- (1-alfa) ^ m .
Diferența apare atunci când unele ipoteze nule sunt adevărate și unele nule ipotezele sunt false. În acest caz, FDR vă indică proporția așteptată de teste semnificative (nu dintre testele toate ) care vor fi erori de tip I. Calculul FDR este atunci nu la fel de simplu, deoarece depinde de proporția de ipoteze nule care sunt false și de putere (probabilitățile de semnificație pentru testele ipotezelor nule false).
Nici FWER, nici FDR nu pot fi mai mari de 1. Valoarea de 1.000 pe care ați calculat-o este o rată de eroare diferită numită rata de eroare per familie: PFER = alfa * m.