Wikipedia:
« Dans les statistiques, le taux derreur par famille (FWER) est la probabilité de faire une ou plusieurs fausses découvertes, ou erreurs de type I, parmi toutes les hypothèses lors de la réalisation de tests dhypothèses multiples. «
» Le taux de fausses découvertes (FDR) est une façon de conceptualiser le taux derreurs de type I dans le test dhypothèse nulle lors de la réalisation de comparaisons multiples. «
Je ne comprends pas la différence entre ces deux concepts. Comment ne signifient-ils pas la même chose?
Peut-être pouvez-vous maider en en élaborant davantage lexemple suivant:
Dites que la probabilité pour une pièce non biaisée de sécarter substantiellement dune distribution tête / queue 50/50 dans une séquence de 1000 lancers est de 0,001.
Si Je veux savoir si une pièce est biaisée, je la lance 1000 fois et si elle montre des têtes ~ 500 fois, je peux être sûr quelle nest pas biaisée.
Cependant, si je lance un million de pièces 1000 fois et juger ces bia sed qui naffiche pas une distribution 50/50 des têtes et des queues, je vais catégoriser les pièces non biaisées comme étant biaisées, car la probabilité quune pièce non biaisée sécarte de la distribution 50/50 est multipliée par le nombre de pièces (1 million).
Ainsi, à partir dun ensemble dun million de pièces non biaisées, je dois mattendre à ce quenviron 1000000 * 0,001 = 1000 pièces sécartent considérablement de la distribution de 50% de queues, 50% de têtes.
Pour autant que je sache, il sagit de tests dhypothèses multiples (synonyme: de comparaisons multiples?) Car je teste lhypothèse « la pièce est impartiale » un million de fois, et le taux de fausses découvertes FDR est de 1000 dans cet exemple.
Mais quel est alors le FWER (taux derreur de la famille)?
Commentaires
- Cela vous aide-t-il? stats.stackexchange.com/questions/59681/…
- Voir la section fdr dans stats.stackexchange.com/questions/166323/…
- @ChristophHanck que fait $ m_0 $ (ou $ m $ dailleurs) représente? (Je ' m faisant référence à votre lien)
- Le nombre dhypothèses vraies.
- @ChristophHanck donc $ m $ est le nombre de toutes les hypothèses?
Réponse
Une partie de la raison pour laquelle vous « êtes confus peut être que vous considérez le spécial cas où toutes les hypothèses nulles sont vraies (cest-à-dire m = m0 ). Lorsque toutes les hypothèses nulles sont vraies, le FWER et le FDR sont bien identiques. Pour m tests indépendants dhypothèses nulles vraies, FDR = FWER = 1- (1-alpha) ^ m .
La différence survient lorsque certaines hypothèses nulles sont vraies et dautres nulles les hypothèses sont fausses. Dans ce cas, le FDR vous indique la proportion attendue de tests significatifs (pas de tous tests) qui seront des erreurs de type I. Le calcul du FDR est alors pas aussi simple, car cela dépend de la proportion dhypothèses nulles qui sont fausses et aussi de la puissance (les probabilités de signification pour les tests des hypothèses fausses nulles).
Ni FWER ni FDR ne peuvent jamais être supérieurs à 1. La valeur de 1 000 que vous avez calculée est un taux derreur différent appelé taux derreur par famille: PFER = alpha * m.