Supposons que nous puissions choisir parmi deux catalyseurs différents. 10 observations sont tirées du premier et 12 de lautre. Si $ s_1 = 14 $ et $ s_2 = 28 $, pouvons-nous rejeter à $ \ alpha = 5 \% $ lhypothèse que les variances sont égales?
Voici ce que lenseignant a fait:
Le rapport est: $ s_1 / s_2 = 0,5. $
Alors
$$ P (F_ {n = 9, m = 11} \ le 0,5) = 0.1538 $$
Puis il dit: la p-value est $ 2 \ times \ min (0.1539; 0.8461) = 0.3074 $ et il rejette $ H_0 $.
Comment obtenir le 0.1538?
Je pense que je peux vérifier une F-table pour n = 9, m = 11, mais que dois-je faire alors pour avoir la probabilité que cette valeur soit $ \ le 0.5 $?
Commentaires
Réponse
La première chose à noter est que puisquil sagit dun test de variance, vous pouvez avoir des F « grands ou petits significatifs, alors que souvent les tables F supposent que vous faites des calculs de type ANOVA (où seules les grandes valeurs de F peuvent provoquer le rejet).
Vous devez donc utiliser le fait que la queue inférieure de $ F (\ nu_1, \ nu_2) $ est la même que linverse de la queue supérieure de $ F (\ nu_2, \ nu_1 ) $.
Il ya « un peu plus de discussion à ce sujet ici
Comment puis-je savoir dans quelle queue je me trouve? – La médiane dune distribution F dans les cas dont vous aurez besoin pour un test de variance être proche de 1. Donc, si la statistique F est inférieure à 1, supposons que vous ayez besoin de la queue inférieure. Sil est plus grand que 1, supposons que vous ayez besoin de la queue supérieure.
Dans lexemple numérique de votre question, F = 0,5 – vous voulez une queue inférieure pour F.
Donc, pour trouver cela, vous devez permuter les degrés de liberté, et les valeurs F seront toutes les inverses de celles dont vous avez besoin. Puisque vous avez besoin de la zone inférieure à 0,5, cest la même chose que de trouver la zone ci-dessus 1 / 0.5 = 2 sur un $ F_ {11,9} $.
Vous devez donc dabord vous soucier du $ \ alpha $ le plus élevé que vous puissiez trouver (0,1 dans les tableaux indiqués ).
Puisque les tables que vous avez liées ont df1 sur les colonnes, vous devez trouver la colonne 11 et la ligne 9 dans ce cas.
Vous n’avez pas de 11, alors regardons 10 et 12:
... 10 12 ⁞ 9 2.41632 2.37888
Alors, comment gérez-vous le fait quil ny ait pas de 11?
Eh bien, tout dabord, notez que tant que df2 est au moins 3 (et ce sera pour un test de variance dans un examen), le tableau des valeurs critiques diminue à mesure que df augmente
Donc, si vous obtenez simplement une borne inférieure de la valeur p, regardez le df inférieur suivant (cest-à-dire comparez avec df1 = 10 dans ce cas).
[Pour plus de précision, consultez cet article sur linterpolation, qui traite de linterpolation en degrés de liberté pour le F vers la fin. Si votre test se profile, je doute que vous ayez le temps pour apprendre autre chose que linterpolation linéaire. Cela suggère une interpolation linéaire dans la réciproque des degrés de liberté.]
La valeur à df1 10, df2 = 9 est 2,41632, ce qui est plus grand que votre 2. Donc vous « est plus proche de 1 que la valeur 0,1.
Ce qui signifie que votre valeur p inférieure à la queue est> 0,1
Et si le problème était similaire à celui de la question mais que le F était de 0,4 $ au lieu de 0,5 $?
1 / 0,4 = 2,5 ce qui signifie quil est plus loin dans la queue que les deux valeurs de 0,10 ci-dessus (2,41632, 2,37888). Donc, la queue inférieure p < 0,10.
Maintenant, comparez avec les valeurs de 5%. Nous voyons que cest moins que les valeurs 12,9 et 10,9 (qui sont toutes deux juste au-dessus de 3). Donc, la queue inférieure p> 0,05. Donc 0,05 $ < p < 0.10 $.
Et si le problème était similaire à celui de la question mais que le F était entre les valeurs pour 10 et 12?
Disons maintenant que le rapport F était de 0,323.
Cest entre la valeur de 0,05 pour 10,9 et 12,9 df – p < 0,05 ou> 0,05?
Possibilité 1: dites que cest environ 0,05.
Possibilité 2: est de dire quil faut au moins le prochain plus petit (p> 0,025)
Possibilité 3: utiliser linterpolation (mais cette fois dans le niveau de signification, pas le df), comme décrit au lien dinterpolation que jai donné précédemment. Cela suggère une interpolation linéaire dans $ \ log \ alpha $.
Personnellement, si jamais jétais possédé pour faire un F-test des variances en pratique *, mais en quelque sorte incapable daccéder même à une calculatrice (avec laquelle faire une intégration numérique rapide), je choisirais loption 3. Si je ne pouvais pas le faire pour une raison quelconque, je choisirais loption 1. Cependant, les attentes de la personne qui la marque pourraient bien être loption 2.
* si je prenais des hallucinogènes puissants, ou si javais subi un grave traumatisme crânien, ou un autre incident me rendant dune manière ou dune autre incapable dapprécier à quel point ce serait une très mauvaise idée.
Valeurs p à deux queues
Il semble que vous ayez lintention de simplement doubler les valeurs p unilatérales pour obtenir des valeurs bilatérales.
Cest très bien dans la mesure où cela disparaît, alors tenez-vous-en à cela, mais pour une discussion de certains des problèmes plus en détail, consultez la discussion dans lexemple à la fin de la réponse ici
[Peut ajouter des détails plus tard]
Réponse
Dabord, le F la statistique nest pas le rapport des écarts std. Cest le rapport des variances. Donc, F est 196/784 = 0,25. La valeur p serait alors 0,047.
Réponse
Si vous avez besoin dune valeur p à deux queues, vous pouvez utiliser:
$$ P- valeur = 2min [P (F_ {n_1-1, n_2-1} \ le F_0), P (F_ {n_1-1, n_2-1} \ ge F_0)] $$
où:
$ F_0 = {S_1 ^ 2 \ over S_2 ^ 2} $
pf(.5,9,11)
donne la réponse[1] 0.1537596